Berdasarkan pengungkapan hubungan investor pada 12 Mei, chip inferensi dalam pengembangan Yuntianliyifei mengadopsi arsitektur GPNPU sebagai peta jalan teknologi inti. Sorotan teknis utamanya meliputi kemampuan pemrograman universal setara GPGPU yang kompatibel dengan ekosistem CUDA arus utama, inti NPU yang dioptimalkan untuk efisiensi inferensi, serta arsitektur memori bertumpuk 3D yang dirancang untuk meningkatkan bandwidth dan mengurangi latensi akses, menembus hambatan bottleneck memori.
Perusahaan ini juga menggunakan arsitektur modular komputasi untuk mendukung pembangunan supernode skala-peningkatan di tingkat rak bagi inferensi model MoE dengan skala triliun dan ratusan triliun. Peta jalan teknologinya menargetkan penurunan biaya token secara eksponensial dan percepatan penerapan deployment aplikasi model besar.
Related News
OpenAI meluncurkan program keamanan siber Daybreak, arsitektur tiga lapis GPT-5.5 melawan Anthropic Mythos
NVIDIA mengumumkan kerja sama strategis jangka panjang dengan IREN, menyiapkan infrastruktur AI 5 GW
Kesepakatan IREN dengan Nvidia menandakan pergeseran ke AI senilai 3,4 miliar dolar AS