Gate News 消息,4 月 24 日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 于 4 月 24 日正式发布,并开源,背景处理长度已从 128K 大幅扩展至 1M,代表近 10 倍的容量提升。华为计算宣布其 Ascend 超算节点产品通过芯片与模型技术的紧密协作,已对 DeepSeek V4 系列模型实现完全支持。
华为 Ascend 950 通过融合算子内核与多流并行技术,实现高吞吐、低延迟的 DeepSeek V4 模型推理部署,以降低 Attention 计算与内存访问的开销。对于输入 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT、单卡 Decode 吞吐量 4,700 TPS;对于输入 8K 的 DeepSeek V4-Flash,达到约 10ms TPOT,吞吐量为 1,600 TPS。Ascend A3 超算节点系列同样实现完全兼容,并提供训练参考实现以便快速微调。基于采用大 EP 模式的 Ascend A3 64 卡超算节点,借助 vLLM 推理引擎,在 8K/1K 输入输出场景下,DeepSeek V4-Flash 的单卡 Decode 吞吐量超过 2,000 TPS。华为全系 Ascend A2、A3 和 950 产品线均支持 DeepSeek V4-Flash 与 V4-Pro。
华为云宣布与 DeepSeek V4 的先发兼容,借助其 MaaS 平台,为开发者提供一键式 API 令牌服务。华为云优化系统层、算子层和集群层能力,以确保快速模型适配与高性能部署。包括金山 WPS 和 360 在内的企业已通过华为云集成了 DeepSeek 的新模型。
燚微(Cambricon)也宣布基于 vLLM 推理框架实现 DeepSeek V4-Flash 与 V4-Pro 的 Day 0 兼容,并将适配代码开源给 GitHub 社区。Cambricon 此前在去年 DeepSeek V3.2 发布时也已实现先发适配,得益于其在 DeepSeek 系列模型上开展了深度的软件-硬件协同性能优化。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Liu(Solana 基金會)主席在 Consensus 2026 表示:為 AI 機器人經濟建構 Solana 的支付基礎設施(Payment Rails)
在 2026 年 Consensus Miami 上,Solana 基金會主席 Lily Liu 表示,像 Western Union 這樣的企業採用穩定幣,證實了 Solana 作為人類與機器經濟之金融基礎設施的角色。
GateNews40分鐘前
台指站穩四萬點、美股創新高,但 AI 產業才剛進入早期階段?
Goldman Sachs 指出,AI 需求將因消費型 agent 工作負載大幅提升 token 消費,2030 年增長或超過 12 倍,月 token 運算可達 60 兆;非 agent 與 consumer agent 差在長時自動化任務,若成真 AI 將進入 agentic 工作流程。Larry Fink 表示算力供給嚴重短缺,未來或出現算力期貨,兩者共同支撐 AI 基礎建設的多頭論;文章認為 AI 仍處於早期階段。
鏈新聞abmedia50分鐘前
九大雲端服務供應商上調 2026 年資本支出(Capex)指引至 8300 億美元
根據 TrendForce,九家主要雲端服務提供商——Google、Amazon Web Services、Meta、Microsoft、Oracle、ByteDance、Tencent、Alibaba 和 Baidu——已將其 2026 年合計資本支出指引上調至約 8300億億美元,係由強勁的 AI 需求所推動。逐年成長 r
GateNews53分鐘前
南韓將於 5 月 22 日起推出 $412M 基金,投向 AI 與高科技產業
根據韓聯社,南韓政府將從 5 月 22 日至 6 月 11 日推出一項規模為 6000 億韓元(4.12 億美元)的基金,以引導更多貸款流向 AI 與其他高科技產業。該基金將支持 AI、可充電電池、氫能、生物科技以及相關領域的企業
GateNews53分鐘前
中國科技股在假期後上漲 9.2%,因 AI 股票領漲帶動反彈
根據 Bloomberg,隨著假期後恢復交易,中國科技股大漲;STAR 50 指數一度上漲 9.2%,創下新高。上證綜合指數一度上漲 1.2%,而創業板指上漲 3.7%,受半導體等相關領域再度受到關注所帶動,
GateNews1小時前
Moonshot AI 募得 20 億美元,估值飆升至超過 2000 億美元
根據 Odaily 和 LatePost,Kimi(Moonshot AI)預計將完成一輪 20 億美元的融資,融後估值超過 2000 億美元,由美團龍珠領投。該輪融資也包含中國移動與 CPE(中信產業基金)等參與者,其中龍珠單獨 i
GateNews1小時前