Naver 2-го числа представив нову модель штучного інтелекту, яка використовує реальну інформацію з постів у мам-кафе та відгуків про ресторани для підвищення точності відповідей. Модель була представлена під час сесії під назвою «Від пошуку до виконання: технологія штучного інтелекту нового покоління, що створює Naver AI Search», яка відбулася в Naver D2SF Gangnam. Легка модель на основі HyperCLOVA X застосовує «harness engineering», щоб відображати життєво орієнтовану інформацію в екосистемі Naver, що дозволяє ШІ надавати відповіді, засновані на реальному досвіді користувачів, а не на загальних даних.
Модель ШІ, розгорнута в пошуковому сервісі Naver «AI Tab», використовує harness engineering — структуру, яка контролює та спрямовує поведінку агента ШІ, подібно до того, як вуздечка керує конем. Коли користувачі шукають вартість навчання в математичній академії, система надає відповіді на основі нещодавніх обговорень батьків у мам-кафе. Коли користувачі запитують про наявність паркування в ресторані, ШІ враховує не лише офіційну інформацію про бізнес, а й реальні відгуки клієнтів, які там паркувалися.
Хан Син-гюн, керівник служби пошуку ШІ Naver, порівняв harness engineering із «робочим чуттям» ШІ, зазначивши, що «для створення агентів ШІ, які добре працюють у сервісах, важливий не лише великий мовний модель (LLM), а й harness engineering, який одночасно забезпечує економічну ефективність та стабільність». Хан додав, що «досвід поєднання пошукової інфраструктури та ноу-хау, накопичених за останні 27 років, величезний контент, як-от блоги та кафе, а також різноманітні сервісні активи, як-от покупки та місця, з технологією ШІ для переходу від пошуку до виконання — це унікальна конкурентоспроможність Naver, яку ніхто не зможе легко повторити».
Naver створив структуру малих мовних моделей (SLM) з поділом праці для підвищення ефективності AI Tab. Замість однієї гігантської LLM, яка виконує всі завдання, Naver поєднує спеціалізовані SLM, що дозволяє знизити операційні витрати, одночасно покращуючи швидкість і якість відповідей. Використовуючи цей метод, Naver знизив операційні витрати на обладнання до 3 разів, а швидкість відповіді покращив більш ніж у 2 рази.
Naver навчив ШІ за допомогою технології Clarify RL (навчання з підкріпленням), яка гарантує, що ШІ не інтерпретує неоднозначні запити довільно, а уточнює наміри користувача за допомогою додаткових запитань. У результаті галюцинації зменшилися до 30 відсоткових пунктів порівняно з HyperCLOVA X.
Лі Кі-чанг, директор Naver Cloud HyperScale AI Model, підкреслив, що «модель, застосована в AI Tab, характеризується оптимізацією всього процесу — від побудови навчальних даних до дизайну моделі та навчання з підкріпленням — відповідно до сервісів Naver», додавши, що «мета — створити модель, яка працює найбільш точно та ефективно в реальних сервісних процесах, таких як пошук, покупка та бронювання користувачами Naver».
Naver представив стратегію вдосконалення мультимодальної технології з використанням SmartLens, розташованого на передній панелі пошукового рядка AI Tab. Мультимодальна технологія дозволяє ШІ розуміти та використовувати різні форми інформації, включаючи зображення та відео, а не лише текст.
Користувачі можуть завантажувати зображення замість тексту в пошуковий рядок і давати команди, як-от «знайти схожі товари» або «забронювати місце з такою атмосферою». Хоча пошук зображень і відео був можливий за допомогою існуючого ШІ, моделі LLM спочатку розпізнавали зображення, а потім проводили текстовий пошук. Натомість мультимодальний агент Naver розуміє весь процес від введення зображення до виконання як єдиний запит.
Юн Сан-ду, керівник Naver Future AI Center, заявив, що «технологія візуального пошуку, яку Naver накопичив через SmartLens майже за 10 років, є ключовою технологією для створення очей, через які агенти ШІ бачать світ», додавши, що «в майбутньому сервіс агента ШІ Naver розвиватиметься в напрямку розуміння намірів користувача не лише через текст, а й через зображення, і з'єднання з реальними діями».
Що Naver представив 2-го числа? Naver 2-го числа представив нову модель ШІ в Naver D2SF Gangnam, яка включає життєво орієнтовану інформацію з постів у мам-кафе та відгуків про ресторани. Модель базується на HyperCLOVA X і використовує harness engineering, щоб відображати реальний досвід користувачів у своїх відповідях.
На скільки Naver знизив операційні витрати за допомогою нової моделі ШІ? Naver знизив операційні витрати на обладнання до 3 разів, використовуючи структуру малих мовних моделей (SLM). Компанія також покращила швидкість відповіді більш ніж у 2 рази та зменшила галюцинації до 30 відсоткових пунктів порівняно з HyperCLOVA X.
Що таке мультимодальна технологія SmartLens у пошуку ШІ Naver? SmartLens — це мультимодальна технологія Naver, яка дозволяє користувачам завантажувати зображення в пошуковий рядок і отримувати відповіді на команди, як-от «знайти схожі товари» або «забронювати місця з такою атмосферою». Технологія розуміє весь процес від введення зображення до виконання як єдиний запит, використовуючи технологію візуального пошуку, яку Naver накопичив майже за 10 років.
Пов’язані новини
Вихід Meta на хмарний ринок підвищує перспективи оцінки Naver та Samsung SDS
Корейські банки прискорюють впровадження штучного інтелекту для боротьби з фінансовим шахрайством
Глобальна комісія AI for Good запущена для розширення доступу та довіри
THEA залучає $8M для створення шару координації ШІ на основі Solana.