Alibaba Cloud Chuyển sang AI Tác nhân, Doanh thu Token Tăng 15 Lần trong 5 Tháng

BABA-0,79%

Alibaba Cloud đã công bố một bản nâng cấp toàn diện cho hệ thống công nghệ full-stack của mình vào ngày 20/05/2026, tại Alibaba Cloud Summit, nhằm định vị cho kỷ nguyên Agentic AI. Công ty giới thiệu các sản phẩm mới gồm website sản phẩm Qwen Cloud, chip AI tự phát triển Pangu M890 tích hợp vào máy chủ siêu node Panjiu AL128 và mô hình flagship Qwen3.7-Max. Sự thay đổi này phản ánh một bước chuyển căn bản trong nhóm người dùng chính của điện toán đám mây: khi các tác nhân AI hoạt động liên tục 24/24 với nhu cầu AI và đám mây “vô hạn”, Alibaba Cloud đang tái cấu trúc toàn bộ stack công nghệ từ các chip lớp nền, hạ tầng Agentic Cloud, mô hình cho đến các nền tảng suy luận. Theo các lãnh đạo công ty, doanh thu AI dựa trên token được kỳ vọng sẽ thay thế ECS (Elastic Compute Service) như dòng sản phẩm lớn nhất của Alibaba Cloud, đánh dấu sự chuyển đổi từ dịch vụ đám mây truyền thống sang các mô hình tiêu thụ do AI thúc đẩy. Trong 5 tháng qua, doanh thu token trung bình hằng ngày của Alibaba Cloud đã tăng xấp xỉ 15 lần, cho thấy quá trình chuyển đổi này đang tăng tốc.

Chuỗi chip Pangu AI và hạ tầng phần cứng

Alibaba Cloud đã công bố lộ trình chip “quyết liệt” tập trung vào Pangu M890, chip AI hợp nhất thống nhất cho huấn luyện và suy luận thế hệ tiếp theo với hiệu năng gấp 3 lần so với thế hệ Pangu M810E trước đó. Máy chủ siêu node Panjiu AL128, được cung cấp bởi M890 và trang bị chip liên kết ICN Switch 1.0 do công ty tự phát triển, cho phép 128 chip AI hoạt động như một đơn vị tính toán duy nhất với độ trễ liên kết ngang hàng (peer-to-peer) dưới 150 nanosecond, giải quyết nhu cầu suy luận đồng thời quy mô lớn và huấn luyện mô hình lớn trong các tình huống agent.

Alibaba Cloud cũng công bố lộ trình chuỗi chip Pangu, cam kết trong hai năm tới sẽ ra mắt 1 thế hệ mới mỗi năm, với các đợt phát hành dự kiến chip Pangu V900 và Pangu J900, mang lại năng lực tính toán cao hơn. Tính đến nay, chuỗi Pangu đã xuất xưởng lũy kế 560.000 chip, phục vụ hơn 400 khách hàng trên hơn 20 ngành.

Tăng trưởng doanh thu token và vị thế thị trường

Alibaba Cloud đang nắm tỷ trọng lớn nhất trong thị trường MaaS (Model-as-a-Service) cho mô hình lớn. Công ty cho biết doanh thu token đã ghi nhận mức tăng tốc đáng kể bắt đầu từ năm nay, giai đoạn trước đó được mô tả chỉ là một “lời mở đầu”. Theo các lãnh đạo công ty, doanh thu token trung bình hằng ngày đã tăng xấp xỉ 15 lần trong 5 tháng qua, phản ánh mức độ nhanh chóng tiếp cận các dịch vụ AI. Đường tăng trưởng này cho thấy các thước đo dựa trên token đang dần trở thành đơn vị đo lường chính cho sự mở rộng doanh thu của Alibaba Cloud.

Thiết kế lại sản phẩm đám mây cho tác vụ agent

Alibaba Cloud đang tái thiết kế căn bản các sản phẩm đám mây để vận hành như các hệ thống “native” cho agent. Các sản phẩm đám mây truyền thống được thiết kế cho người vận hành, nhưng tác vụ agent lại có những đặc điểm không tương thích với điện toán đám mây thông thường: độ co giãn bất quy tắc, vòng đời ngắn và khả năng mở rộng tức thời. Công ty đã thực hiện Skill-ification, chuyển đổi MCP (Model Context Protocol) và chuẩn hóa CLI (Command Line Interface) cho tất cả sản phẩm đám mây, cho phép agent gọi khả năng đám mây như các lệnh gọi hàm chuẩn hóa.

Triết lý thiết kế lại này đã thúc đẩy Alibaba Cloud ra mắt Qwen Cloud, một website sản phẩm mới tách riêng khỏi cổng Alibaba Cloud chính. Trang chủ của website hiển thị một lệnh prompt duy nhất để agent có thể đọc được. Tất cả năng lực dịch vụ mô hình được đóng gói dưới dạng Skills và công cụ CLI chuẩn hóa, giúp agent phân tích chỉ dẫn, nắm bắt đầy đủ năng lực nền tảng và tự chủ gọi các hàm cần thiết. Theo lãnh đạo công ty, phán đoán cốt lõi phía sau sáng kiến này là người dùng chính của điện toán đám mây trong tương lai sẽ là các agent AI thay vì các kỹ sư con người, đòi hỏi một thay đổi căn bản về kiến trúc sản phẩm và thiết kế tương tác.

Năng lực và hiệu năng của mô hình Qwen3.7-Max

Alibaba Cloud đã phát hành Qwen3.7-Max như mô hình ngôn ngữ lớn flagship mới nhất của mình. Trong bảng xếp hạng Arena global large model blind test, Qwen3.7-Max đứng đầu trong nhóm các mô hình Trung Quốc, vượt qua Kimi-K2.6, DeepSeek-v4-pro và GLM-5.1, đồng thời tiến gần mức hiệu năng của các mô hình mạnh nhất của GPT, Claude và Gemini.

Một nghiên cứu tình huống triển khai thực tế cho thấy năng lực tự chủ của mô hình vượt ra ngoài các bài kiểm thử chuẩn. Trên chip Pangu M890 — một nền tảng mà mô hình chưa từng gặp trong quá trình huấn luyện — Qwen3.7-Max đã tự mình hoàn tất một nhiệm vụ triển khai và tối ưu hóa kernel tính toán AI theo chuẩn sản xuất trong 35 giờ, chỉ dựa trên mô tả tác vụ, đạt hiệu năng gấp 10 lần phiên bản tham chiếu chính thức. Case này minh họa một bước chuyển căn bản trong mục tiêu thiết kế mô hình: từ tối ưu hóa để phù hợp sở thích của con người sang tối ưu hóa để hoàn thành tác vụ một cách tự chủ. Theo lãnh đạo bộ phận mô hình lớn của Alibaba, Qwen3.7-Max được thiết kế để đóng vai trò lõi thông minh của các agent, được trang bị khả năng lập kế hoạch tự chủ, lặp liên tục và phối hợp đa công cụ.

Alibaba Cloud cũng xác định AI Coding (lập trình do AI thúc đẩy) là một lĩnh vực ứng dụng chính. Công ty cho biết AI Coding vừa tạo ra các ứng dụng mới, đồng thời hiện đại hóa mã nguồn cũ tích lũy qua nhiều thập kỷ. Các lãnh đạo công ty nhấn mạnh rằng AI Coding nhắm vào chi tiêu phát triển phần mềm và thuê ngoài bên ngoài vốn trước đây nằm ngoài phạm vi nắm bắt doanh thu của các dịch vụ đám mây truyền thống, thể hiện một sự mở rộng đáng kể về cơ hội thị trường có thể tiếp cận.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận