Microsoft sedang dalam pembicaraan untuk memasok chip AI Maia 200 dari perusahaan AI San Francisco, Anthropic—di balik Claude—melalui Azure. Kesepakatan ini belum final, tetapi bisa membantu Microsoft mempersempit jarak dengan Amazon dan Google dalam menawarkan chip AI kustom kepada pelanggan cloud. Pada bulan November, Microsoft berinvestasi US$5 miliar pada Anthropic. Anthropic berkomitmen untuk menghabiskan US$30 miliar di Azure, sementara startup tersebut juga menggunakan GPU Nvidia serta chip kustom dari Amazon dan Google.
Maia 200 Targetkan Efisiensi Inference AI
Maia 200 buatan Microsoft dirancang untuk inference AI—yakni pekerjaan menjalankan model terlatih untuk menghasilkan respons—bukan sebagai chip serbaguna. Menjalankan layanan AI skala besar dari waktu ke waktu bisa menelan biaya lebih besar daripada pelatihan model sejak awal. Microsoft mengatakan Maia 200 menawarkan performa 30% lebih baik per dolar, yang dapat memangkas biaya harian bagi pelanggan bervolume tinggi atau memungkinkan fitur seperti jendela konteks yang lebih panjang tanpa menaikkan anggaran. Chip ini juga bertujuan menjaga waktu respons tetap stabil selama lonjakan trafik, yang penting bagi perusahaan yang membangun produk di atas model Anthropic.
Chip Kustom Mengubah Persaingan AI
Pembicaraan ini menunjukkan perlombaan kini bergeser dari sekadar membeli lebih banyak unit pemrosesan grafis Nvidia (GPU). Perusahaan mengombinasikan pembuat model dengan platform chip kustom dan sistem cloud yang menjalankannya. Anthropic sudah mengadopsi pendekatan tersebut bersama Google dan Broadcom, sebuah perancang chip sekaligus perusahaan infrastruktur. Anthropic menyetel model Claude agar bekerja lebih erat dengan tumpukan perangkat keras dan perangkat lunak Tensor Processing Unit (TPU) milik Google. Pengaturan serupa dengan Microsoft untuk Maia 200 dapat mendukung rencana multicloud dengan lebih dari satu pemasok chip, memperluas akses Anthropic ke silikon kustom melalui Azure. Pengiriman chip kustom dari penyedia cloud diproyeksikan naik 44,6% pada 2026, dibandingkan pertumbuhan 16,1% untuk GPU.