Генеральний директор MiniMax Intelligence Лі Дацай заявив на конференції 2026 Beijing Zhiyuan Conference, що агентна технологія потребує зваженого підходу, навіть попри швидкі темпи прогресу. Спілкуючись із Pengpai News та іншими медіа, Лі пояснив, що публічні очікування щодо агентів із нульовою похибкою перевищують те, що нинішня траєкторія технічного розвитку здатна дати, адже технології ще потрібен час для дозрівання. Він назвав 2025 першим роком агентів, прогнозуючи вибухове зростання, яке суттєво вплине на людське суспільство, але підкреслив потребу в спокійній оцінці наявних технічних можливостей у сфері AI-агентів.
Лі Дацай визнав, що інтеграція великих моделей і агентної технології розвивається дуже швидко, а деякі сценарії вже приземляються в практичні застосування. Говорячи про обмеження агентів, Лі напряму сказав: «Проблеми всюди». Він розгорнув думку, що «еволюція моделі та технології Agent відбувається дуже швидко», пояснивши: «можливо, сьогодні дехто має 10% рівня помилки, а наступного місяця рівень помилки падає до 1% — швидка еволюція стала базовим трендом».
Лі Дацай безпосередньо кинув виклик поширеній у галузі думці, що «створення хороших малих моделей має спиратися на дистиляцію надвеличезних фундаментальних моделей», назвавши це «когнітивною помилкою». Він пояснив: «За дистиляцією стоїть дуже конкретна передумова: сам об’єкт дистиляції має бути хорошою моделлю. Дистиляція по суті така: для компаній, які не мають можливості самостійно розробляти фундаментальні моделі, але хочуть “приземлити” застосування, вони беруть наявні невеликі фундаментальні моделі й отримують можливості під конкретні сценарії через донавчання. У цьому процесі вони, можливо, дійсно використовують інші великі моделі для синтезу даних, щоб малі моделі набули відповідних можливостей». Лі заявив, що це парадигма для всіх тренувань великих моделей, а не лише для малих.
Лі Дацай розкрив: «Цього року, оскільки індустрія загалом перевела інференс на вітчизняні чипи, ми також поступово переносимо тренування на вітчизняні чипи та вітчизняні кластери». Він визначив два паралельні шляхи покращення екосистеми вітчизняних обчислювальних потужностей: перший — “знизу вгору” (bottom-up) шліфування, де компанії великих моделей поступово вдосконалюють екосистему власними тренувальними практиками, «як змочування кам’яної плити біт-бай-біт, що потребує часу». Другий шлях — планування “зверху вниз” (top-down), прикладом якого є глибока співпраця MiniMax із Zhiyuan Research Institute над екосистемою ПЗ FlagOS, де компанії великих моделей і чипові компанії встановлюють глибоку співпрацю та рухаються вперед за планом. Лі Юсюань, керівник MiniMax Intelligence AIInfra, зазначив, що інференс насправді потребує вищої точності, ніж тренування, і запропонована MiniMax технологія масштабування моделей стала ключовим проривом: досягнення ефекту передбачення великих моделей за допомогою дуже малих моделей, глибока оцінка на вітчизняних чипах, узгодження експериментальних деталей із закордонними виробниками та підтвердження того, що точність тренування є придатною. MiniMax розкрила, що досягла вкрай низького квантування-aware training на платформі Huawei, досягнувши 95% ефективності звичайного тренування. Лі Дацай пояснив, що втрата 5% походить від накладних витрат самого квантизатора, і завдяки глибокій співпраці з Huawei ці накладні витрати було оптимізовано до мінімуму.
MiniMax Intelligence повідомила, що п’яте покоління MiniCPM Small Cannon версії 1B отримало оцінку 17,9 на авторитетному оцінюванні ArtificialAnalysis (AA). Дослідники з відкритої спільноти порівняли результати й виявили, що GPT-4o (200 млрд параметрів), випущений у травні 2024 року, набрав 18,3-18,6 на тому ж типі оцінювання, а різниця між двома моделями становить лише 0,4-0,7 бала. Лі Дацай заявив: «У 2024 році ми прогнозували, що до кінця 2026 року рівень інтелекту edge-моделей може досягти рівня GPT-4. За наявними даними ціль досягнуто із випередженням графіка».
Під час попереднього «MiniMax Open Source Week» MiniMax Intelligence випустила дві edge-великі моделі: MiniCPM5-1B і BitCPM-CANN. MiniCPM5-1B знову підняла верхню межу щільності інтелекту моделі: маючи лише масштаб 1B параметрів, вона випередила всі моделі нижче 2B параметрів на міжнародно відомому лідерборді AA-Index; порівняно з Qwen3.5-2B, випущеною на 3 місяці раніше, MiniCPM5-1B не лише показує кращу продуктивність, а й удвічі зменшила кількість параметрів.
Модель MiniCPM5-1B була попередньо навчена незалежно розробленим AI-тренувальним фреймворком MiniMax Intelligence ForgeTrain — першим у світі фреймворком попереднього тренування великих моделей виробничого класу, повністю написаним AI, без участі людини-програміста. Швидкість тренування на 10% вища, ніж у NVIDIA Megatron.
Що Лі Дацай сказав про обмеження агентної технології на 2026 Beijing Zhiyuan Conference?
Лі Дацай заявив, що очікування суспільства щодо агентів із нульовою похибкою перевищують те, що поточна крива технічного розвитку здатна забезпечити, і технології ще потрібен час, щоб дозріти. Він описав наявні обмеження агентів як «проблеми всюди», але підкреслив, що рівень помилок стрімко знижується — від 10% до 1% протягом місяця в деяких випадках.
Як продуктивність MiniCPM-5 1B порівнюється з GPT-4o на бенчмарку ArtificialAnalysis?
MiniCPM-5 1B (з 1B параметрів) набрала 17,9 на оцінюванні ArtificialAnalysis, тоді як GPT-4o (з 200B параметрів, випущений у травні 2024 року) набрав 18,3-18,6 на тому ж оцінюванні, тож різниця між двома моделями становить лише 0,4-0,7 бала.
Що таке ForgeTrain і як він порівнюється з NVIDIA Megatron?
ForgeTrain — це незалежно розроблений MiniMax Intelligence AI-тренувальний фреймворк: перший у світі фреймворк попереднього тренування великих моделей виробничого класу, повністю написаний AI, без участі людини-програміста. Він навчає на 10% швидше, ніж NVIDIA Megatron.
Пов’язані новини
Гендиректор Microsoft: ІІ «щит» — це контур навчання, і компанії не можуть перекласти навчання на підрядників
Керівник SpaceX публічно заявив, що «злиття Tesla» є здійсненним, з інтеграцією AI-інфраструктури для обробки даних і напрямку з чипами
Засновник Animoca Сіу заявив, що креативність буде найбільш затребуваною навичкою в епоху ШІ
ChatGPT Pro забезпечує 14 000 доларів США вартості AI у тесті підписки Semianalysis
Ripple, MetaMask, Mastercard створюють інфраструктуру для платіжних AI-агентів