Генеральний директор MiniMax: Edge Model Intelligence відповідає GPT-4, агентській технології потрібен час

2026-06-15 06:12:28

Генеральний директор MiniMax Intelligence Лі Дацай заявив на конференції 2026 Beijing Zhiyuan Conference, що агентна технологія потребує зваженого підходу, навіть попри швидкі темпи прогресу. Спілкуючись із Pengpai News та іншими медіа, Лі пояснив, що публічні очікування щодо агентів із нульовою похибкою перевищують те, що нинішня траєкторія технічного розвитку здатна дати, адже технології ще потрібен час для дозрівання. Він назвав 2025 першим роком агентів, прогнозуючи вибухове зростання, яке суттєво вплине на людське суспільство, але підкреслив потребу в спокійній оцінці наявних технічних можливостей у сфері AI-агентів.

Лі Дацай описує обмеження агентної технології та стрімку еволюцію

Лі Дацай визнав, що інтеграція великих моделей і агентної технології розвивається дуже швидко, а деякі сценарії вже приземляються в практичні застосування. Говорячи про обмеження агентів, Лі напряму сказав: «Проблеми всюди». Він розгорнув думку, що «еволюція моделі та технології Agent відбувається дуже швидко», пояснивши: «можливо, сьогодні дехто має 10% рівня помилки, а наступного місяця рівень помилки падає до 1% — швидка еволюція стала базовим трендом».

Генеральний директор MiniMax спростовує хибне уявлення про дистиляцію малих моделей

Лі Дацай безпосередньо кинув виклик поширеній у галузі думці, що «створення хороших малих моделей має спиратися на дистиляцію надвеличезних фундаментальних моделей», назвавши це «когнітивною помилкою». Він пояснив: «За дистиляцією стоїть дуже конкретна передумова: сам об’єкт дистиляції має бути хорошою моделлю. Дистиляція по суті така: для компаній, які не мають можливості самостійно розробляти фундаментальні моделі, але хочуть “приземлити” застосування, вони беруть наявні невеликі фундаментальні моделі й отримують можливості під конкретні сценарії через донавчання. У цьому процесі вони, можливо, дійсно використовують інші великі моделі для синтезу даних, щоб малі моделі набули відповідних можливостей». Лі заявив, що це парадигма для всіх тренувань великих моделей, а не лише для малих.

MiniMax переводить тренувальні навантаження на вітчизняні чипи

Лі Дацай розкрив: «Цього року, оскільки індустрія загалом перевела інференс на вітчизняні чипи, ми також поступово переносимо тренування на вітчизняні чипи та вітчизняні кластери». Він визначив два паралельні шляхи покращення екосистеми вітчизняних обчислювальних потужностей: перший — “знизу вгору” (bottom-up) шліфування, де компанії великих моделей поступово вдосконалюють екосистему власними тренувальними практиками, «як змочування кам’яної плити біт-бай-біт, що потребує часу». Другий шлях — планування “зверху вниз” (top-down), прикладом якого є глибока співпраця MiniMax із Zhiyuan Research Institute над екосистемою ПЗ FlagOS, де компанії великих моделей і чипові компанії встановлюють глибоку співпрацю та рухаються вперед за планом. Лі Юсюань, керівник MiniMax Intelligence AIInfra, зазначив, що інференс насправді потребує вищої точності, ніж тренування, і запропонована MiniMax технологія масштабування моделей стала ключовим проривом: досягнення ефекту передбачення великих моделей за допомогою дуже малих моделей, глибока оцінка на вітчизняних чипах, узгодження експериментальних деталей із закордонними виробниками та підтвердження того, що точність тренування є придатною. MiniMax розкрила, що досягла вкрай низького квантування-aware training на платформі Huawei, досягнувши 95% ефективності звичайного тренування. Лі Дацай пояснив, що втрата 5% походить від накладних витрат самого квантизатора, і завдяки глибокій співпраці з Huawei ці накладні витрати було оптимізовано до мінімуму.

MiniCPM-5 1B досягає майже рівня GPT-4o на бенчмарку ArtificialAnalysis

MiniMax Intelligence повідомила, що п’яте покоління MiniCPM Small Cannon версії 1B отримало оцінку 17,9 на авторитетному оцінюванні ArtificialAnalysis (AA). Дослідники з відкритої спільноти порівняли результати й виявили, що GPT-4o (200 млрд параметрів), випущений у травні 2024 року, набрав 18,3-18,6 на тому ж типі оцінювання, а різниця між двома моделями становить лише 0,4-0,7 бала. Лі Дацай заявив: «У 2024 році ми прогнозували, що до кінця 2026 року рівень інтелекту edge-моделей може досягти рівня GPT-4. За наявними даними ціль досягнуто із випередженням графіка».

Під час попереднього «MiniMax Open Source Week» MiniMax Intelligence випустила дві edge-великі моделі: MiniCPM5-1B і BitCPM-CANN. MiniCPM5-1B знову підняла верхню межу щільності інтелекту моделі: маючи лише масштаб 1B параметрів, вона випередила всі моделі нижче 2B параметрів на міжнародно відомому лідерборді AA-Index; порівняно з Qwen3.5-2B, випущеною на 3 місяці раніше, MiniCPM5-1B не лише показує кращу продуктивність, а й удвічі зменшила кількість параметрів.

ForgeTrain AI-Written Framework навчає на 10% швидше, ніж NVIDIA Megatron

Модель MiniCPM5-1B була попередньо навчена незалежно розробленим AI-тренувальним фреймворком MiniMax Intelligence ForgeTrain — першим у світі фреймворком попереднього тренування великих моделей виробничого класу, повністю написаним AI, без участі людини-програміста. Швидкість тренування на 10% вища, ніж у NVIDIA Megatron.

FAQ

Що Лі Дацай сказав про обмеження агентної технології на 2026 Beijing Zhiyuan Conference?

Лі Дацай заявив, що очікування суспільства щодо агентів із нульовою похибкою перевищують те, що поточна крива технічного розвитку здатна забезпечити, і технології ще потрібен час, щоб дозріти. Він описав наявні обмеження агентів як «проблеми всюди», але підкреслив, що рівень помилок стрімко знижується — від 10% до 1% протягом місяця в деяких випадках.

Як продуктивність MiniCPM-5 1B порівнюється з GPT-4o на бенчмарку ArtificialAnalysis?

MiniCPM-5 1B (з 1B параметрів) набрала 17,9 на оцінюванні ArtificialAnalysis, тоді як GPT-4o (з 200B параметрів, випущений у травні 2024 року) набрав 18,3-18,6 на тому ж оцінюванні, тож різниця між двома моделями становить лише 0,4-0,7 бала.

Що таке ForgeTrain і як він порівнюється з NVIDIA Megatron?

ForgeTrain — це незалежно розроблений MiniMax Intelligence AI-тренувальний фреймворк: перший у світі фреймворк попереднього тренування великих моделей виробничого класу, повністю написаний AI, без участі людини-програміста. Він навчає на 10% швидше, ніж NVIDIA Megatron.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

06-14 10:49

Рей Даліо: Принципове мислення має супроводжувати використання ШІ в ухваленні інвестиційних рішень

06-14 02:55

Засновник Meta Марк Цукерберг визнає помилки в роботі Meta AI та обіцяє без загальних звільнень по всій компанії у 2026 році

06-13 07:37

X-Agent запускає Open AGI Developer Day у Шанхаї 13 червня та презентує агентний application layer

Пов'язані статті

Гендиректор Microsoft: ІІ «щит» — це контур навчання, і компанії не можуть перекласти навчання на підрядників

Market Whisper6год тому

Керівник SpaceX публічно заявив, що «злиття Tesla» є здійсненним, з інтеграцією AI-інфраструктури для обробки даних і напрямку з чипами

Market Whisper9год тому