DeepSeek Potong Harga API sebesar 90%, Jalankan V4 di Chip Huawei, dan Dorong Inference AI ke dalam Perang Harga yang Sepenuhnya


DeepSeek memotong harga API sebesar 90% pada cache hit input dan menawarkan diskon 75% untuk V4-Pro hingga 5 Mei
Itu membuat harga cache-hit V4-Pro sekitar $0,0036 per juta token, sementara harga output jauh di bawah model frontier Barat yang mengenakan biaya $12–$25 per juta token
V4-Pro memiliki 1,6T parameter total, dengan 49B aktif per proses inference. V4-Flash adalah versi yang lebih kecil dengan 284B parameter
V4 berjalan di chip Huawei Ascend, bukan NVIDIA
Ini juga menggunakan jauh lebih sedikit komputasi. Pada jendela konteks 1 juta token, V4-Pro dilaporkan hanya membutuhkan 27% dari komputasi yang dibutuhkan oleh V3.2
Kinerja masih sedikit di belakang GPT-5.4 dan Gemini 3.1 Pro
Lihat Asli
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan