Anthropic представила стратегію Advisor: Opus як радник у парі з Sonnet для виконання завдань, що підвищує ефективність і знижує витрати на 12%

Anthropic 9 квітня оголосила про офіційне впровадження «Advisor-стратегії» в Claude Platform. Тепер розробники можуть через Messages API надати Opus роль радника, поєднуючи Sonnet або Haiku як виконавця, щоб у межах одного запиту до API досягати інтелектуальних показників, близьких до рівня Opus, водночас суттєво знижуючи витрати. Наразі ця функція доступна у форматі публічного тестового випуску.

Механізм роботи: виконавець автоматично консультується з Opus, коли стикається зі складною задачею

Ключова ідея Advisor-стратегії полягає в розділенні міркування та виконання. Коли розробник додає advisor-інструмент у виклик Messages API, після того як агент Sonnet або Haiku під час виконання завдання стикається із проблемним рішенням, він автоматично звертається до Opus, отримує рекомендацію щодо плану й продовжує виконання. Увесь процес завершується в межах одного запиту до API, без додаткового налаштування чи оркестрації з боку розробника.

Така архітектура схожа на розподіл ролей у команді — між старшим консультантом і виконавцями: Opus відповідає за високо-рівневі стратегічні рішення, тоді як Sonnet або Haiku — за практичне виконання; обидва працюють разом у межах одного робочого процесу.

Практичне тестування: продуктивність зростає, а витрати нижчі

Згідно з опублікованими Anthropic даними оцінювання, у базовому тесті SWE-bench Multilingual продуктивність Sonnet у поєднанні з advisor від Opus вища на 2,7 процентного пункта, ніж при використанні одного лише Sonnet, при цьому вартість кожного завдання навпаки зменшилася на 11,9%.

Причина зниження витрат у тому, що більшість завдань усе ще обробляє більш дешевий Sonnet або Haiku, а Opus викликається лише в ключових точках прийняття рішень, уникаючи високої плати за повне використання Opus.

Значення для розробників

Advisor-стратегія надає розробникам AI agent новий варіант компромісу «вартість—ефективність». Раніше розробникам доводилося обирати між «повним використанням Opus, але з високими витратами» і «повним використанням Sonnet, але ризиком помилок у складних задачах». Тепер можна отримати переваги обох шляхом гібридної архітектури.

Суспільна реакція на це була гарячою: хтось із розробників порівняв це з «лінією порятунку» «дзвінка за допомогою» з телевізійної передачі для мільйонерів — коли виконавець працює самостійно, а по-справжньому складні питання потребують поради від майстра.

Ця стаття Anthropic: Advisor-стратегія — Opus як радник у поєднанні з Sonnet, підвищення ефективності та зниження вартості на 12% вперше з’явилася на 鏈新聞 ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Дослідження Microsoft: лише 13% працівників, які отримують корпоративні заохочення для інновацій на основі ШІ, зазнали невдачі у своїй роботі

Згідно з щорічним звітом Microsoft «Індекс робочих тенденцій», опублікованим 5 травня, звіт проаналізував мільйони анонімних сигналів продуктивності Microsoft 365 та опитав 20 000 співробітників у кількох ринках, зокрема в США, Великій Британії, Індії та Японії. Дані звіту показали, що лише 13% співробітників заявили: у разі спроб покращити роботу за допомогою ШІ та відсутності очікуваного ефекту роботодавець надає заохочення.

MarketWhisper8хв. тому

Meta розробляє AI-асистента Hatch для конкуренції з OpenClaw, до кінця червня завершить внутрішнє тестування

За повідомленням Financial Times від 5 травня, Meta розробляє AI-асистента (Hatch) для пересічних споживачів, натхненого OpenClaw від OpenAI. Компанія має намір до кінця червня завершити внутрішнє тестування; водночас Meta планує до четвертого кварталу цього року інтегрувати автономний агентний інструмент для покупок у свої сервіси Instagram.

MarketWhisper17хв. тому

Судове слухання OpenAI: Брокман свідчить, що Маск раніше казав, що безпеку не забезпечуватиме, а акції буде ризиковано підтримувати і діяти грубо

За повідомленням New York Post від 6 травня, генеральний директор OpenAI Грег Брокман 5 травня дав свідчення в Окружному федеральному суді в Окленді, штат Каліфорнія, розкривши, що під час виходу Маска з ради директорів OpenAI у 2018 році він звернувся до всіх членів команди з промовою, заявивши, що коли він просуває AI у Tesla, «не витрачатиме час на безпеку». Також стверджується, що у 2017 році він разом із співзасновником OpenAI обговорював угоду щодо часток в об’єднаннях, що мало ескалацію.

MarketWhisper1год тому

Індійські кіберзахисні компанії використовують ШІ, щоб скоротити тестування вразливостей до годин

Індійські кібербезпекові компанії, зокрема Indusface та Astra Security, впроваджують AI-агенти, створені на базі великих мовних моделей, щоб прискорити тестування програмних вразливостей з днів або тижнів до годин, повідомляє The Economic Times. Зміни відображають зростання швидкості дій атакувальників і з’являючуся здатність AI-інструментів

CryptoFrontier1год тому

Спростовує AI-«бульбашку»! Генеральний директор BlackRock: нестача обчислювальних потужностей створить «ринок ф’ючерсів на обчислювальну потужність»

Світовий попит на ШІ та обчислювальні потужності різко зростає. CEO BlackRock Фінк спростував ідею «ШІ-бульбашки» та заявив, що дефіцит потужностей створить новий клас активів — «ф’ючерси на обчислювальну потужність». Щоб відповідати тренду, BlackRock разом із Microsoft, Nvidia та MGX інвестує сотні мільярдів доларів у дата-центри й енергетичну інфраструктуру. GIP приблизно за 40 мільярдів доларів придбала Aligned Data Centers і також за 10,7 мільярда доларів у партнерстві з EQT придбала AES. Фінк та інші, зокрема Brookfield, вважають це довгостроковою, стійкою можливістю для інвестицій із «пошаровим» ефектом складного відсотка, а дохід може зберігатися десятиліттями.

ChainNewsAbmedia2год тому
Прокоментувати
0/400
Немає коментарів