DeepSeek V4 以 1M 上下文窗口发布;华为 Ascend 与寒武纪芯片实现全面兼容

Gate News 消息,4月24日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 已于4月24日正式发布并开源。其上下文处理长度由 128K 显著扩展至 1M,容量提升近 10 倍。华为计算宣布其 Ascend 超级节点产品通过芯片与模型技术的紧密协同,已全面支持 DeepSeek V4 系列模型。

华为 Ascend 950 通过融合算子内核与多流并行技术,实现高吞吐、低延迟的 DeepSeek V4 模型推理部署,从而降低 Attention 计算与内存访问开销。对于输入 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT,单卡 Decode 吞吐为 4,700 TPS;对于输入低于 8K 的 DeepSeek V4-Flash,其达到约 10ms TPOT,吞吐为 1,600 TPS。Ascend A3 超级节点系列也实现全面兼容,并提供训练参考实现以便快速进行微调。基于搭载大 EP 模式的 Ascend A3 64 卡超级节点,借助 vLLM 推理引擎,DeepSeek V4-Flash 在 8K/1K 输入输出场景下实现单卡 Decode 吞吐超过 2,000 TPS。华为全系列 Ascend A2、A3 和 950 产品线均支持 DeepSeek V4-Flash 与 V4-Pro。

华为云宣布与 DeepSeek V4 的率先兼容,通过其 MaaS 平台为开发者提供一键式 API Token 服务。华为云优化系统层、算子层与集群层能力,以确保快速模型适配与高性能部署。包括金山 WPS 和 360 在内的企业已通过华为云集成 DeepSeek 新模型。

寒武纪 同样宣布基于 vLLM 推理框架对 DeepSeek V4-Flash 和 V4-Pro 实现 Day 0 兼容,并将适配代码开源给 GitHub 社区。寒武纪此前在去年 DeepSeek V3.2 发布时已实现率先适配:通过对 DeepSeek 系列模型进行深度的软件-硬件协同性能优化。

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Kasus ransomware melonjak 389% pada 2025 menjadi 7.831, lapor Fortinet

Menurut Fortinet, kasus ransomware global naik 389% year-on-year menjadi 7.831 pada 2025 karena pelaku kejahatan siber memanfaatkan AI dan mempercepat serangan terhadap kerentanan perangkat lunak. Manufaktur menjadi sektor yang paling ditargetkan dengan 1.284 kasus, disusul layanan bisnis dengan 824 dan ritel dengan 682. Fortine

GateNews3menit yang lalu

Blackstone, KKR, EQT dalam Pembicaraan dengan Alphabet untuk Penawaran Portofolio AI

Menurut Bloomberg, Blackstone, KKR, dan EQT yang berbasis di Swedia sedang berdiskusi dengan Alphabet untuk memberi perusahaan portofolio mereka akses ke model AI Google melalui kontrak tingkat portofolio. Pembicaraan ini tidak bersifat eksklusif dan mungkin tidak menghasilkan kesepakatan. Pengaturan tersebut akan memberi Google ruang lingkup yang lebih luas

GateNews13menit yang lalu

Lab AI Finland QuTwo Menyelesaikan Putaran $29M Seed pada $380M Penilaian; Perusahaan Sebelumnya Pendirinya Silo AI Dijual ke AMD senilai $665 Juta

Menurut Beating, lab AI Finlandia QuTwo menyelesaikan putaran pendanaan awal senilai 25 juta euro (sekitar $29 juta) dengan valuasi pascamoney sebesar 325 juta euro (sekitar $380 juta). Pendiri dan Ketua Eksekutif Peter Sarlin sebelumnya mendirikan Silo AI, yang diakuisisi AMD senilai $665 juta pada 2024.

GateNews43menit yang lalu

DeepSeek Dinilai $45B sebagai Dana Semikonduktor Negara Tiongkok Bidik Investasi Utama

Menurut ChainCatcher, dana investasi semikonduktor yang didukung negara Tiongkok sedang dalam pembicaraan untuk memimpin putaran pendanaan Seri A DeepSeek, yang berpotensi menilai lab AI tersebut sekitar 45 miliar dolar AS. Negosiasi pendanaan masih berlangsung, menurut empat orang yang mengetahui

GateNews1jam yang lalu

Riset Microsoft: Hanya 13% karyawan yang gagal dalam inovasi tempat kerja berbasis AI menerima insentif perusahaan

Berdasarkan laporan Indeks Tren Pekerjaan tahunan yang dirilis Microsoft pada 5 Mei, laporan tersebut menganalisis miliaran sinyal produktivitas Microsoft 365 yang anonim, serta melakukan survei terhadap 20.000 karyawan di beberapa pasar seperti Amerika Serikat, Inggris, India, dan Jepang. Data laporan menunjukkan hanya 13% karyawan yang mengatakan bahwa pemberi kerja akan memberikan insentif ketika mereka mencoba meningkatkan pekerjaan dengan AI tetapi tidak mendapatkan hasil yang diharapkan.

MarketWhisper2jam yang lalu

Meta mengembangkan asisten AI Hatch untuk menyaingi OpenClaw, menyelesaikan uji internal sebelum akhir Juni

Menurut Financial Times pada 5 Mei, Meta sedang mengembangkan asisten AI untuk konsumen umum (Hatch), terinspirasi dari OpenClaw milik OpenAI, dengan target menyelesaikan uji internal sebelum akhir Juni; Meta juga berencana sebelum kuartal keempat tahun ini mengintegrasikan alat belanja berbasis agen yang berdiri sendiri ke layanan Instagram miliknya.

MarketWhisper2jam yang lalu
Komentar
0/400
Tidak ada komentar