Gate News 消息,4 月 25 日——DeepSeek 於 4 月 24 日發布 V4-Pro 與 V4-Flash 的預覽版本;兩者皆為開放權重模型,擁有一百萬 token 的上下文視窗。V4-Pro 具備 1.6 兆的總參數,但在每次推論時僅啟用 490 億參數,並採用 Mixture-of-Experts 架構。V4-Flash 具備 2,840 億的總參數,其中啟用 130 億。
定價顯著低於競品:V4-Pro 的每百萬輸入 token 成本為 $1.74,每百萬輸出 token 成本為 $3.48——約比 OpenAI 的 GPT-5.5 Pro 低 98% ($30 input,$180 output);且其成本約為 Claude Opus 4.7 的 五十分之一。V4-Flash 的價格為每百萬 token 輸入 $0.14、輸出 $0.28。兩款模型均以 MIT 授權開源,且可在本地免費運行。
DeepSeek 透過兩種新的注意力機制實現效率提升:Compressed Sparse Attention 與 Heavily Compressed Attention,將計算成本降低至 V4-Pro 前代機型的 27% (V3.2),以及將 V4-Flash 降至 10%。該公司在部分 V4 訓練中使用了華為 Ascend 晶片,繞過了美國對先進 Nvidia 處理器的出口限制。DeepSeek 表示,待 2026 年下半年新增 950 個新超節點啟動後,定價還將進一步下調。
在效能基準測試中,V4-Pro-Max 在 Codeforces 競賽程式設計 (3,206 分排名第一,位於人類參賽者中的約第 23 名),並在 Apex Shortlist 數學題上取得 90.2% 的分數,而 Claude Opus 4.6 為 85.9%。然而,它在多任務基準上表現落後:MMLU-Pro (87.5% 對比 Gemini-3.1-Pro 的 91.0%),以及 Humanity’s Last Exam (37.7% 對比 44.4%)。在長上下文任務上,V4-Pro 領先開源模型,但在 MRCR 檢索測試中落後於 Claude Opus 4.6。
V4-Pro 引入“interleaved thinking(交錯式思考)”,使代理工作流程能在多次工具呼叫之間保留推理上下文,而無需在步驟之間刷新。兩款模型均支援與 Claude Code 與 OpenCode 的編碼整合。根據 DeepSeek 對 85 位開發者進行的調查,52% 的受訪者表示 V4-Pro 已可作為其預設的程式代理,另有 39% 傾向採用。舊版 deepseek-chat 與 deepseek-reasoner 端點將於 2026 年 7 月 24 日退役。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Arm 警告 智慧型手機 弱點,目標 推動 AI 晶片 成長以彌補
Arm Holdings 警告,智慧型手機市場疲弱正在壓縮該晶片設計公司的關鍵營收來源,然而根據執行長 Rene Haas 在一場財報電話會議中的說法,AI 晶片業務的成長預期將足以抵銷影響。本季前一季的手機出貨量下滑,虧損集中在
Crypto Frontier7分鐘前
DeepSeek 於 $45B 估值期間籌集資金,因應 AI 競爭
TechCrunch 報導,DeepSeek 這家中國 AI 實驗室正與各方洽談,以在首次融資輪中籌集資金,該公司估值據稱為 450 億美元。該估值較僅數週前的約 200 億美元估值大幅上升;這是在外界關注公司用於
Crypto Frontier26分鐘前
華為、燧原科技在國內晶片上整合 DeepSeek V4;規劃於 2026 年部署 750,000 台 Ascend 950PR 單元
根據《南華早報》,華為與寒武紀已在 2026 年開始將 DeepSeek V4 與國內晶片平台整合。華為表示 V4 現已在其 Ascend 950PR 以及其他 Ascend 處理器上運行,並計劃在今年於量產後生產約 75 萬顆 950PR 晶片,後續將在量產 st
GateNews47分鐘前
微軟可能推遲 2030 零碳電力目標,因 AI 資料中心擴建帶動能源需求
根據彭博社報導,微軟可能會延後或取消其 2030 年目標,讓每一小時的所有用電都能與零碳電力相匹配。由於 AI 資料中心擴張推高能源需求與成本,公司在 2021 年宣布的 100/100/0 目標比該公司的年度再生能源配對目標更嚴格 targe
GateNews47分鐘前
Google DeepMind 將訓練 AI 於《EVE Online》,並在 Fenris Creations 持有少數股權
根據彭博社,5 月 6 日,Google DeepMind 宣布將在《Eve Online》上訓練 AI 系統,並將入股 Fenris Creations 的少數股權;該公司正是多人太空遊戲的背後推手。這項投資金額達數百萬美元。DeepMind 高階主管 Adrian Bolton 表示《Eve Online》測試 AI
GateNews47分鐘前
Apple 將研發投入提升至 30 年新高,以推動 AI 投資
根據 CNBC 報導,蘋果在其 3 月季度將營收的 10.3% 用於研發,隨著公司加速 AI 開發,這標誌著其至少 30 年來研發占比最高。該公司表示,研發支出年增近 34%,而營收成長 17%。公司
Crypto Frontier56分鐘前