Alibaba Cloud Beralih ke Agentic AI, Pendapatan Token Melonjak 15x dalam 5 Bulan

BABA-0,84%

Alibaba Cloud mengumumkan peningkatan menyeluruh pada sistem teknologi full-stack-nya pada 20 Mei 2026, di Alibaba Cloud Summit, dengan posisi untuk memasuki era Agentic AI. Perusahaan ini meluncurkan produk baru termasuk situs web produk Qwen Cloud, chip AI Pangu M890 buatan sendiri yang diintegrasikan ke server supernode Panjiu AL128, serta model andalan Qwen3.7-Max. Pergeseran ini mencerminkan perubahan mendasar pada pengguna utama komputasi awan: karena agen AI berjalan 24 jam terus-menerus dengan kebutuhan AI dan cloud yang tidak terbatas, Alibaba Cloud merestrukturisasi seluruh tumpukan teknologinya mulai dari chip lapisan dasar, infrastruktur Agentic Cloud, model, hingga platform inferensi. Menurut eksekutif perusahaan, pendapatan AI berbasis token diperkirakan akan menggantikan ECS (Elastic Compute Service) sebagai lini produk terbesar Alibaba Cloud, menandai peralihan dari layanan cloud tradisional ke model konsumsi berbasis AI. Dalam lima bulan terakhir, pendapatan token harian rata-rata Alibaba Cloud telah tumbuh kira-kira 15 kali, menandakan percepatan transformasi ini.

Seri Chip Pangu AI dan Infrastruktur Perangkat Keras

Alibaba Cloud merilis peta jalan chip yang agresif dengan fokus pada Pangu M890, chip AI pelatihan-dan-inferensi terpadu generasi berikutnya dengan performa tiga kali lipat dibanding generasi sebelumnya Pangu M810E. Server supernode Panjiu AL128, yang ditenagai oleh M890 dan dilengkapi chip interkoneksi ICN Switch 1.0 buatan sendiri, memungkinkan 128 chip AI berfungsi sebagai satu unit komputasi dengan latensi peer-to-peer di bawah 150 nanodetik, untuk menangani inferensi konkuren massal dan kebutuhan pelatihan model besar pada skenario agen.

Alibaba Cloud mengungkapkan peta jalan seri chip Pangu, dengan komitmen untuk merilis satu generasi baru setiap tahun selama dua tahun berikutnya, dengan rilis terencana chip Pangu V900 dan Pangu J900 yang menawarkan peningkatan kapasitas komputasi. Sampai saat ini, seri Pangu telah mengirimkan total 560.000 chip, melayani lebih dari 400 pelanggan di lebih dari 20 industri.

Pertumbuhan Pendapatan Token dan Posisi Pasar

Alibaba Cloud memegang pangsa terbesar di pasar MaaS (Model-as-a-Service) untuk model besar. Perusahaan melaporkan bahwa pendapatan token mengalami percepatan signifikan mulai tahun ini, dengan periode sebelumnya yang digambarkan hanya sebagai “prolog.” Menurut eksekutif perusahaan, pendapatan token harian rata-rata meningkat kira-kira 15 kali dalam lima bulan terakhir, yang mencerminkan adopsi cepat layanan AI. Pola pertumbuhan ini menunjukkan bahwa metrik berbasis token tengah menjadi unit pengukuran utama untuk ekspansi pendapatan Alibaba Cloud.

Redesain Produk Cloud untuk Beban Kerja Berbasis Agen

Alibaba Cloud secara fundamental mendesain ulang produk cloud agar beroperasi sebagai sistem asli untuk agen. Produk cloud tradisional dirancang dengan mempertimbangkan operator manusia, tetapi beban kerja agen memiliki karakteristik yang tidak kompatibel dengan komputasi awan konvensional: elastisitas yang tidak teratur, siklus hidup yang singkat, dan penskalaan instan. Perusahaan telah melakukan Skill-ification, transformasi MCP (Model Context Protocol), serta standardisasi CLI (Command Line Interface) untuk semua produk cloud, sehingga agen dapat memanggil kapabilitas cloud sebagai panggilan fungsi standar.

Filosofi redesain ini mendorong Alibaba Cloud meluncurkan Qwen Cloud, situs web produk baru yang terpisah dari portal utama Alibaba Cloud. Halaman beranda situs web ini menampilkan satu instruksi prompt yang dapat dibaca agen. Semua kapabilitas layanan model dikemas sebagai Skills standar dan alat CLI, memungkinkan agen mem-parsing instruksi, memperoleh kapabilitas penuh platform, dan secara otonom memanggil fungsi yang diperlukan. Menurut pimpinan perusahaan, pertimbangan inti yang mendasari inisiatif ini adalah bahwa pengguna utama komputasi awan masa depan akan menjadi agen AI, bukan insinyur manusia, sehingga diperlukan pergeseran mendasar pada arsitektur produk dan desain interaksi.

Kapabilitas dan Kinerja Model Qwen3.7-Max

Alibaba Cloud merilis Qwen3.7-Max sebagai model bahasa besar andalan terbarunya. Pada peringkat Arena global blind test model besar, Qwen3.7-Max berada di peringkat pertama di antara model-model Tiongkok, mengungguli Kimi-K2.6, DeepSeek-v4-pro, dan GLM-5.1, sekaligus mendekati level performa model terkuat GPT, Claude, dan Gemini.

Studi kasus produksi menunjukkan kemampuan otonom model di luar penilaian standar. Pada chip Pangu M890—platform yang belum pernah ditemui model saat pelatihan—Qwen3.7-Max secara independen menyelesaikan tugas implementasi dan optimasi kernel komputasi AI berbasis produksi selama lebih dari 35 jam hanya dengan deskripsi tugas, dengan mencapai performa 10 kali lipat dibanding versi referensi resmi. Kasus ini mencontohkan pergeseran fundamental tujuan desain model: dari mengoptimalkan penyelarasan preferensi manusia menjadi mengoptimalkan penyelesaian tugas secara otonom. Menurut kepemimpinan divisi model besar Alibaba, Qwen3.7-Max dirancang untuk menjadi inti cerdas bagi agen, dilengkapi kemampuan perencanaan otonom, iterasi berkelanjutan, dan kolaborasi lintas alat.

Alibaba Cloud telah mengidentifikasi AI Coding (pemrograman berbasis AI) sebagai domain aplikasi utama. Perusahaan mencatat bahwa AI Coding menghasilkan aplikasi baru sekaligus memodernisasi kode lama yang terkumpul selama puluhan tahun. Eksekutif perusahaan menyoroti bahwa AI Coding menargetkan pengembangan perangkat lunak dan belanja outsourcing eksternal yang sebelumnya berada di luar penangkapan pendapatan layanan cloud tradisional, yang merepresentasikan perluasan signifikan peluang pasar yang dapat dijangkau.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar