DeepSeekがV4-ProとV4-Flashモデルを、OpenAIのGPT-5.5 Proより98%低コストでリリース

ゲートニュース(4月25日)— DeepSeekは4月24日にV4-ProおよびV4-Flashのプレビュー版をリリースした。どちらも100万トークンのコンテキストウィンドウを持つオープンウェイトモデルである。V4-Proは総パラメータ1.6兆を備えるが、Mixture-of-Expertsアーキテクチャを用いて推論1回あたり49億のみを有効化する。V4-Flashは総パラメータ2840億で、アクティブは130億。

価格は競合に比べて大幅に低い:V4-Proは入力が100万トークンあたり$1.74、出力が100万トークンあたり$3.48で、OpenAIのGPT-5.5 Proに比べて約98%安い—($30 input、$180 output)およびClaude Opus 4.7の約5分の1のコストである。V4-Flashは100万トークンあたり入力$0.14、出力$0.28。両モデルはMITライセンスの下でオープンソースで、ローカルで無料実行できる。

DeepSeekは2つの新しい注意メカニズムによって効率向上を実現した:Compressed Sparse AttentionとHeavily Compressed Attentionで、V4-Proの前身 (V3.2)の計算コストを27%に、V4-Flashでは10%にまで削減する。DeepSeekはV4を部分的にHuawei Ascendチップで学習し、高度なNvidiaプロセッサに対する米国の輸出規制を回避した。同社は、2026年後半に新たな950のスーパーノードがオンラインになると、価格がさらに下がると述べた。

性能ベンチマークでは、V4-Pro-MaxはCodeforcesの競技プログラミング (3,206スコアで1位となり、人間の参加者の中で約23位に相当)し、Apex Shortlistの数学問題では90.2%を獲得した(Claude Opus 4.6は85.9%)。しかしマルチタスクのベンチマークでは後れを取る:MMLU-Pro (87.5%対Gemini-3.1-Proの91.0%)、Humanity’s Last Exam (37.7%対44.4%)。長いコンテキストのタスクでは、V4-Proはオープンソースモデルに勝つが、MRCRのリトリーバルテストではClaude Opus 4.6に敗れる。

V4-Proは「interleaved thinking」を導入し、エージェントのワークフローが、複数のツール呼び出しにわたって推論コンテキストを保持し、ステップ間でフラッシュしないようにする。両モデルはClaude CodeおよびOpenCodeとのコーディング統合をサポートする。DeepSeekの開発者サーベイ(85ユーザー)によると、52%がV4-Proはデフォルトのコーディングエージェントとして準備できていると回答し、39%が導入に前向きだった。旧deepseek-chatおよびdeepseek-reasonerのエンドポイントは、2026年7月24日に廃止される。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

xAI、Anthropicと提携してColossusコンピューティングへのアクセスを提供

xAIとAnthropicの公式発表によれば、この2社は新しい計算(コンピューティング)の提携を確立した。SpaceXのxAIは、AnthropicがColossusの計算リソースにアクセスできるようにする契約に署名した。Anthropicは、この追加の計算能力を活用する予定で、

GateNews16分前

OpenAI が MRC スーパコンピュータ ネットワーク プロトコルを公開!NVIDIA、AMD、Microsoft と協力して Stargate の基盤インフラを構築

OpenAI は、AI スーパーコンピュータ・ネットワーク・プロトコル MRC を公開し、AMD、Microsoft、NVIDIA などと連携して OCP でオープンソース化しました。MRC はデータを分割しつつ複数の経路を同時に通し、マイクロ秒レベルで回避を行うことで輻輳を減らし、GPU の同期を維持して、大規模な学習用クラスタの転送ボトルネックを解決します。Stargate のテキサス州 Abilene などの拠点では、すでに 800Gb/s のインターフェースが導入され、実際の訓練にも投入されています。

ChainNewsAbmedia42分前

AI採用プラットフォームのEthosが5月6日にa16z主導でシリーズAの資金調達2,275万ドルを完了

BlockBeatsによると、ロンドン拠点のAI採用プラットフォームEthosは5月6日に、Andreessen Horowitz(a16z)が主導しGeneral Catalystが参加した形で、シリーズAラウンド2,275万ドルの資金調達を完了した。同プラットフォームはAIを使って候補者を面接し、分析する。

GateNews1時間前

OpenAI、AMD、Intel、NVIDIAとともにMRCネットワークプロトコルを発表。10万基以上のGPUに対応

5月6日のOpenAIの発表によると、同社はAMD、Broadcom、Intel、Microsoft、そしてNVIDIAと提携して、大規模なAIトレーニング・クラスターのGPU相互接続のためのオープンなネットワーク・プロトコルであるMultipath Reliable Connection(MRC)を立ち上げました。このプロトコルは、単一のデータ伝送を分割します。

GateNews2時間前

Hut 8の株が34%急騰、98億ドルのAIデータセンターリース案件で躍進

The Blockによると、Hut 8 Corp.の株は、同社がテキサス州ヌエセス郡でNVIDIAの計算アーキテクチャ向けに設計された人工知能データセンター・キャンパスのために98億ドル規模のリース契約を締結したことを受け、本日時間外取引で34%上昇し、107.87ドルとなった。取引はHuの最初のフェーズを表している

GateNews3時間前

クリーン・スパークのCTO:AI/HPCインフラにはビットコインマイニングよりも多くのネットワークリソースが必要

CoinDeskのインタビューによると、CleanSparkの最高技術責任者(CTO)であるテイラー・モニグは、ビットコインのマイニングからAI/HPCインフラへ移行するには、より多くの冗長性が必要で、即興性はより少なくて済むと述べた。「1つのラックのネットワークファイバーは、ビットコインのマイニング施設全体に匹敵する」モニグ

GateNews3時間前
コメント
0/400
コメントなし