Blockify переписує корпоративний RAG: використовує IdeaBlock замість Chunking, стискає у 40 разів, зменшує token у 3 рази

Компанія, що створює нові інструменти для оптимізації корпоративних даних за допомогою ШІ, Blockify: 9 травня її зібрав і просуває akshay_pachaar, який заявляє, що у процесі RAG (Retrieval-Augmented Generation) вона може стиснути корпоративні бази даних у 40 разів, зменшити витрати на токени під час запиту в 3 рази та підвищити точність векторного пошуку в 2,3 раза. Офіційний GitHub Blockify повідомляє: продукт представила Iternal Technologies; він використовує структуру «IdeaBlock», яка замінює традиційне chunking, а також через дедуплікацію та об’єднання дозволяє тримати базу знань стислою, послідовною та керованою.

Ключова концепція: IdeaBlock замість традиційного chunking

Технічний дизайн Blockify:

Традиційний підхід: розбивати довгі документи на чанки фіксованого розміру, вбудовувати вектори, під час детекції брати top-k

Підхід Blockify: перетворювати вихідний контент на IdeaBlock — XML-структуровані одиниці знань

Кожен IdeaBlock містить: запитання, перевірені відповіді, tag, сутності, ключові слова

Схожі IdeaBlock автоматично дедуплікуються та об’єднуються, тож база знань не роздувається зі зростанням контенту

Проблема традиційного chunking у тому, що одна й та сама інформація може повторюватися в кількох чанках, спричиняючи надмірність під час пошуку та марну витрату токенів; IdeaBlock через дедуплікацію підвищує щільність знань, а той самий зміст виражає в меншому обсязі зберігання.

Конкретні переваги: стиснення в 40 разів, токени — у 3 рази менше, точність — у 2,3 раза вища

Опубліковані Blockify показники конкретної ефективності:

Стиснення даних: корпоративна база даних зменшується до приблизно 2,5% від початкового обсягу (40 разів стиснення), збереження 99% і більше інформації

Токени на кожен запит: із ~303 (традиційний chunk) до ~98 (IdeaBlock) — ефективність у 3,09 раза

Точність векторного пошуку: підвищення в 2,29 раза

Загальне покращення точності: приблизно 78 разів (сумарний ефект від дедуплікації та покращення пошуку)

Розрахунок економії витрат: 1 млрд запитів/рік, економія токен-костів близько 73,8 тис. доларів

Загальне підвищення точності у 78 разів — це комплексний ефект: дедуплікація зменшує шум, IdeaBlock-структурований контент дружніший для векторного пошуку, а також зниження кількості токенів на одну відповідь одночасно зменшує простір для помилок моделі.

Масштаб інтеграції: LlamaIndex, LangChain, Milvus, Cloudflare та інші популярні фреймворки

Вже інтегровані розробницькі інструменти та інфраструктура Blockify:

RAG-фреймворки: LlamaIndex, LangChain

Керування знаннями: Obsidian

Векторні бази даних: Milvus, Elastic, Supabase

Edge-обчислення: Cloudflare

Low-code інтеграції: n8n (через шаблони робочих процесів)

Стратегія інтеграції Blockify — «не замінювати наявні RAG-фреймворки, а бути шаром попередньої оптимізації даних». Розробники можуть у наявних процесах LlamaIndex або LangChain замінити крок chunking на Blockify, тоді інші етапи залишаться без змін.

Конкретні події, за якими можна буде стежити далі: зростання кількості зірок у GitHub Blockify та рівень прийняття спільнотою, чи Iternal Technologies подала або розкрила технічні деталі щодо IdeaBlock-структури (зараз наголошується на «patented ingestion»), а також чи будуть убудовані подібні логіки дедуплікації в налаштуваннях за замовчуванням у популярних RAG-фреймворках.

Ця стаття «Blockify переписує корпоративний RAG: IdeaBlock замість chunking, стиснення в 40 разів, token-и — у 3 рази менше» вперше з’явилась на сайті Мережа новин ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів