Топові AI-моделі відстають у рутинних корпоративних задачах, заявляє Databricks: менші спеціалізовані моделі випереджають

Повідомлення Gate News, 20 квітня — Топові AI-моделі чудово розв’язують складні задачі, як-от олімпіадну математику, але важко справляються з рутинною роботою в корпораціях, за словами Девіда Мейєра з Databricks. Деякі моделі можуть виправити неправильний номер рахунка-фактури замість того, щоб позначити це як помилку, тоді як інструменти для програмування на кшталт Claude також можуть програвати на завданнях із data engineering.

Розрив пояснюється принциповими відмінностями між корпоративними даними та публічними текстами вебу, які використовують для навчання великих моделей. Корпоративні дані часто мають розпливчасті назви стовпців, багато порожніх полів і коди, збережені як звичайний текст. В одному академічному дослідженні F1-показник AI-моделі, який поєднує точність і повноту, знизився з 0.94 на публічних даних до 0.07 на корпоративних даних для завдання з data engineering. Крім того, великі моделі, як правило, за замовчуванням спираються на знайомі патерни з тренувань; деякі, як (Structured Query Language), за замовчуванням використовували навіть після отримання інструкцій і документації щодо власної мови запитів компанії.

Менші відкриті моделі з підлаштуванням за допомогою reinforcement learning можуть ефективніше виконувати конкретні роботи за значно нижчі витрати на навчання, ніж великі універсальні моделі. Databricks будує менші AI-агенти для конкретних робочих процесів, зокрема KARL, який використовує reinforcement learning для багатокрокового міркування з документами компанії. Індустрія переходить від опори на гігантські моделі до гібридних архітектур, де малі ефективні моделі обробляють рутинний обсяг, а потім ескалюють лише неясні або складні випадки до більших, дорожчих систем.

Нещодавно Databricks придбала Quotient AI, щоб допомогти великим підприємствам запускати AI-агенти більш надійно. Конкуренція в AI-бізнесі тепер зосереджується на проходженні повного AI-циклу, включно з системами зворотного зв’язку для відстеження помилок і безперервного поліпшення моделей з часом, тож інструменти для оцінювання й налаштування стають дедалі ціннішими після розгортання.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Bakkt завершує придбання DTR на тлі зростання доходів і стратегічної перебудови

Bakkt завершила придбання Distributed Technologies Research — крок, покликаний інтегрувати інфраструктуру для стейблкоїнів, зручних для роботи з штучним інтелектом (AI), у свої базові фінансові сервіси. Оновлення глобального клірингу Bakkt Inc. завершила придбання Distributed Technologies

Coinpedia52хв. тому

AI-агент Manfred формує компанію та готується торгувати криптовалютою до кінця травня

AI-агент Manfred створив власну компанію та вже має криптогаманець і бізнес-документи для найму співробітників, здійснення платежів і проведення операцій. Планується, що агент розпочне торгівлю криптовалютою до кінця

GateNews2год тому

AI-агент Менфред створює компанію, отримує криптогаманць і підтвердження для найму перед стартом біржових торгів у кінці травня

AI-агент Manfred створив власну компанію та отримав криптогаманець разом із обліковими даними для найму персоналу, здійснення платежів і ведення бізнесу, повідомляють у звітах. Агент планує розпочати торгівлю криптовалютою до кінця

GateNews8год тому

MoonPay запускає MoonAgents Card — віртуальну Mastercard для AI-агентів — у п’ятницю

За даними The Block, MoonPay у п’ятницю запустила MoonAgents Card — віртуальну дебетову картку Mastercard. Картка призначена і для AI-агентів, і для користувачів: вона конвертує стейблкоїни у фіат у момент оплати та дає змогу витрачати кошти в будь-якому онлайн-магазині по всьому світу, який приймає Mastercard. Картка i

GateNews13год тому

AI-агент Менфред створює компанію та готується торгувати криптовалютою до кінця травня

AI-агент Manfred уже заснував компанію та отримав криптогаманець разом із реквізитами, щоб наймати співробітників, здійснювати платежі й вести бізнес. Агент має розпочати криптотрейдинг до кінця

GateNews14год тому

Користувачі ChatGPT тепер можуть отримувати доступ до підписок на платформі OpenClaw, — оголошує Сем Альтман

Згідно з оголошенням Сема Альтмана сьогодні, користувачі ChatGPT тепер можуть входити на платформу агентів OpenClaw, використовуючи свої акаунти ChatGPT, і напряму отримувати доступ до наявних підписок ChatGPT на цій платформі.

GateNews19год тому
Прокоментувати
0/400
Немає коментарів