Alibaba Cloud переходить до агентного ШІ, дохід від токенів зріс у 15 разів за 5 місяців

BABA-0,84%

Alibaba Cloud оголосила про масштабне оновлення своєї повнофункціональної технологічної системи 20 травня 2026 року на саміті Alibaba Cloud Summit, позиціонуючи себе для ери Agentic AI. Компанія представила нові продукти, зокрема вебсайт продукту Qwen Cloud, саморозроблений AI-ішіп Pangu M890, інтегрований у сервер Panjiu AL128 supernode, а також флагманську модель Qwen3.7-Max. Цей зсув відображає фундаментальну зміну в тому, хто є ключовим користувачем хмарних обчислень: оскільки AI-агенти працюють цілодобово безперервно з нескінченними потребами в AI та хмарі, Alibaba Cloud перебудовує весь технологічний стек — від чипів нижнього рівня, Agentic Cloud інфраструктури, моделей до платформ інференсу. За словами керівників компанії, дохід від токенізованого AI має замінити ECS (Elastic Compute Service) як найбільшу продуктову лінійку Alibaba Cloud, позначаючи перехід від традиційних хмарних сервісів до моделей споживання, керованих AI. Протягом останніх п’яти місяців денна середня виручка Alibaba Cloud від токенів зросла приблизно у 15 разів, сигналізуючи про прискорення цієї трансформації.

Серія AI-чипів Pangu та апаратна інфраструктура

Alibaba Cloud оприлюднила агресивну чипову дорожню карту, сфокусовану на Pangu M890 — наступному поколінні уніфікованого AI-чипа для тренування й інференсу, продуктивність якого втричі вища за попереднє покоління Pangu M810E. Сервер Panjiu AL128 supernode, що живиться від M890 та оснащений саморозробленим чипом міжз’єднання ICN Switch 1.0, дозволяє 128 AI-чипам працювати як єдиний обчислювальний блок із peer-to-peer затримкою нижче 150 наносекунд, закриваючи потреби масового одночасного інференсу та великомасштабного тренування моделей у сценаріях для агентів.

Alibaba Cloud розкрила дорожню карту серії чипів Pangu, пообіцявши випускати одне нове покоління щороку протягом наступних двох років, із запланованими релізами чипів Pangu V900 та Pangu J900, які забезпечать зростання обчислювальної потужності. Наразі серія Pangu поставила кумулятивно 560 тис. чипів, обслуговуючи понад 400 клієнтів у більш ніж 20 індустріях.

Зростання токенової виручки та ринкова позиція

Alibaba Cloud займає найбільшу частку на ринку MaaS (Model-as-a-Service) для великих моделей. Компанія повідомила, що виручка від токенів суттєво прискорилася, починаючи з цього року, причому попередній період вона охарактеризувала як лише «пролог». За словами керівників компанії, денна середня виручка від токенів зросла приблизно у 15 разів за останні п’ять місяців, що відображає швидке впровадження AI-сервісів. Така траєкторія зростання вказує на те, що токенозалежні метрики стають основною одиницею вимірювання для розширення виручки Alibaba Cloud.

Переробка хмарних продуктів під агентні навантаження

Alibaba Cloud фундаментально перерозробляє хмарні продукти, щоб вони працювали як agent-native системи. Традиційні хмарні продукти були створені з огляду на людських операторів, але агентні навантаження мають характеристики, несумісні зі звичайними хмарними обчисленнями: нерівномірна еластичність, короткі життєві цикли та миттєве масштабування. Компанія виконала Skill-ification, трансформацію MCP (Model Context Protocol) і стандартизацію CLI (Command Line Interface) усіх хмарних продуктів, що дає змогу агентам викликати можливості хмари як стандартизовані виклики функцій.

Ця філософія переробки спонукала Alibaba Cloud запустити Qwen Cloud — новий вебсайт продукту, окремий від головного порталу Alibaba Cloud. На головній сторінці сайту відображається одна інструкція-підказка, яку може прочитати агент. Усі можливості сервісів моделей інкапсульовані як стандартизовані Skills і CLI-інструменти, що дозволяє агентам розібрати інструкцію, отримати повні можливості платформи та автономно викликати потрібні функції. За словами керівництва компанії, ключове міркування, що лежить в основі цієї ініціативи, полягає в тому, що майбутніми основними користувачами хмарних обчислень будуть AI-агенти, а не інженери, тож потрібен фундаментальний зсув в архітектурі продукту та дизайні взаємодії.

Можливості й продуктивність моделі Qwen3.7-Max

Alibaba Cloud випустила Qwen3.7-Max як свою найновішу флагманську велику мовну модель. У глобальному рейтингу сліпих тестів Arena для великих моделей Qwen3.7-Max посідає перше місце серед китайських моделей, випереджаючи Kimi-K2.6, DeepSeek-v4-pro та GLM-5.1, водночас наближаючись до рівня продуктивності найсильніших моделей GPT, Claude та Gemini.

Кейсове виробниче дослідження демонструє автономні можливості моделі понад стандартні бенчмарки. На чипі Pangu M890 — платформі, з якою модель не стикалася під час тренування — Qwen3.7-Max самостійно виконала завдання з реалізації та оптимізації AI-kernel виробничого класу за 35+ годин, використовуючи лише опис задачі, досягнувши 10-кратної продуктивності проти офіційної еталонної версії. Цей кейс ілюструє фундаментальну зміну цілей у дизайні моделей: від оптимізації під узгодження з уподобаннями людини до оптимізації для автономного завершення завдань. За даними керівництва підрозділу великих моделей Alibaba, Qwen3.7-Max створювали як інтелектуальне ядро агентів, оснащене автономним плануванням, безперервною ітерацією та можливостями співпраці між інструментами.

Alibaba Cloud визначила AI Coding (програмування, кероване AI) як один із ключових напрямів застосування. Компанія зазначає, що AI Coding створює нові застосунки, паралельно модернізуючи застарілий код, накопичений за десятиліття. Керівники компанії підкреслили, що AI Coding орієнтований на витрати на розробку ПЗ і зовнішнє підрядне виконання, які раніше були поза межами доходів традиційних хмарних сервісів, і це означає суттєве розширення потенційної ринкової можливості.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів