V4のコーディング重視は戦略的な転換となるだろう。R1は純粋な推論—論理、数学、形式的証明—に重点を置いていたのに対し、V4は推論と非推論タスクを組み合わせたハイブリッドモデルであり、高精度のコード生成が直接収益につながるエンタープライズ開発者市場をターゲットにしている。支配的地位を獲得するには、V4は現在80.9%のSWE-bench Verified記録を持つClaude Opus 4.5を上回る必要がある。しかし、過去のリリース例から見ても、中国のAI研究所が直面する制約があっても達成不可能ではない可能性がある。
インサイダーによると、DeepSeek V4はClaudeやChatGPTをコード作成で上回り、数週間以内にリリースされる予定です
要約
DeepSeekは、V4モデルを2月中旬頃にリリースする計画であると報じられており、内部テストの結果から見て、シリコンバレーのAI大手企業は警戒すべきだと_The Information_は伝えている。杭州を拠点とするAIスタートアップは、自然な形で旧正月の2月17日頃にリリースを目指している可能性があり、コーディングタスクに特化したモデルを開発しているとされる。プロジェクトに直接関わる人物は、V4はAnthropicのClaudeやOpenAIのGPTシリーズを内部ベンチマークで上回り、特に非常に長いコードプロンプトの処理において優れていると主張している。ただし、モデルに関するベンチマークや情報は公開されていないため、これらの主張を直接検証することは不可能である。DeepSeekも噂を確認していない。
それでも、開発者コミュニティは公式発表を待たずに動き出している。Redditのr/DeepSeekやr/LocalLLaMAではすでに盛り上がりを見せており、ユーザーはAPIクレジットを備蓄し、Xの愛好者たちはV4がDeepSeekの地位を確固たるものにし、シリコンバレーの数十億ドルルールに従わない小さな挑戦者としての立場を強化するとの予測を素早く共有している。
これはDeepSeekにとって初めての破壊的な動きではない。2025年1月に同社がR1推論モデルをリリースした際、世界市場で1兆円規模の売りが引き起こされた。理由は?DeepSeekのR1は、OpenAIのo1モデルと数学や推論のベンチマークで一致し、開発コストはわずか$1 百万ドルと報告されており、競合他社の約68分の1のコストで済んだとされる。その後、V3モデルはMATH-500ベンチマークで90.2%を記録し、Claudeの78.3%を大きく上回り、「V3.2 Speciale」アップデートにより性能もさらに向上した。
![]$6 https://img-cdn.gateio.im/social/moments-83d3038cbc-b429f26fbf-8b7abd-e2c905(
画像:DeepSeek
V4のコーディング重視は戦略的な転換となるだろう。R1は純粋な推論—論理、数学、形式的証明—に重点を置いていたのに対し、V4は推論と非推論タスクを組み合わせたハイブリッドモデルであり、高精度のコード生成が直接収益につながるエンタープライズ開発者市場をターゲットにしている。支配的地位を獲得するには、V4は現在80.9%のSWE-bench Verified記録を持つClaude Opus 4.5を上回る必要がある。しかし、過去のリリース例から見ても、中国のAI研究所が直面する制約があっても達成不可能ではない可能性がある。
秘密のソース 噂が本当だと仮定すると、この小さな研究所はどうやってそんな偉業を成し遂げるのか?その答えは、2024年1月1日に発表された研究論文「Manifold-Constrained Hyper-Connections(mHC)」にあるかもしれない。創設者の梁文峰と共著のこの新しいトレーニング手法は、大規模言語モデルのスケーリングにおける根本的な問題—モデルの容量を拡大しつつ、訓練中に不安定になったり爆発したりしないようにする方法—に対処している。従来のAIアーキテクチャは、すべての情報を狭い一つの経路を通じて強制的に流すが、mHCはその経路を複数のストリームに拡張し、情報交換を可能にしながら訓練崩壊を防ぐ。
![])https://img-cdn.gateio.im/social/moments-b12022db7d-1d4a815ecd-8b7abd-e2c905(
画像:DeepSeek
Counterpoint ResearchのAI主任アナリスト、Wei Sunは、mHCを「衝撃的なブレークスルー」と呼び、_Business Insider_に対して、「計算ボトルネックを回避し、知能の飛躍を引き出すことができる」と述べた。彼女は、米国の輸出制限により高度なチップへのアクセスが制限されている状況でも、DeepSeekは「計算能力のボトルネックを突破し、知性の飛躍を実現できる」と指摘した。Omdiaのチーフアナリスト、李哲は、DeepSeekが方法論を公開する意欲を示したことは、「中国AI産業に新たな自信をもたらしている」と述べている。同社のオープンソース戦略は、かつてOpenAIがそうだったように、クローズドモデルや数十億ドルの資金調達ラウンドに移行する前の、開発者からの支持を集めている。
すべての人が納得しているわけではない。Redditの一部開発者は、DeepSeekの推論モデルが単純なタスクに過剰な計算リソースを浪費していると不満を漏らし、一方で批評家は、同社のベンチマークは実世界の複雑さを反映していないと指摘している。2025年4月にバイラルになったMediumの投稿「DeepSeekはダメだ—もう我慢できない」では、モデルが「定型文のナンセンスとバグ」を生成し、「幻のライブラリ」を作り出すと非難された。DeepSeekには負の側面もある。プライバシー問題がつきまとい、一部政府はDeepSeekのネイティブアプリを禁止している。中国との関係やモデルの検閲に関する疑問も、技術的議論に地政学的な緊張をもたらしている。それでも、勢いは止まらない。DeepSeekはアジアで広く採用されており、V4がコーディングの約束を果たせば、西洋でもエンタープライズの採用が進む可能性が高い。
![])https://img-cdn.gateio.im/social/moments-d696befe55-74b0ad8396-8b7abd-e2c905(
画像:Microsoft
また、タイミングも重要だ。_Reuters_によると、DeepSeekは当初2025年5月にR2モデルをリリースする予定だったが、創設者の梁がその性能に不満を抱き、計画を延長した。現在、V4は2月をターゲットにしており、R2は8月に続く可能性があるため、同社は緊急性または自信を持って動いていることを示唆している。おそらく、その両方だ。