DeepSeekの学習データが33Tまで倍増、リリースを遅らせた不安定性が発生

Gate Newsメッセージ、4月24日 — DeepSeekのV4技術レポートによると、V4-FlashとV4-Proはそれぞれ32Tおよび33Tトークンで事前学習されており、V3で使用された約15Tトークンの約2倍です。レポートでは、学習中に「重大な不安定性の課題」に遭遇したことを認めており、損失スパイクがMixture-of-Experts (MoE)層の異常によって繰り返し発生していました。ルーティング機構そのものがこれらの異常を悪化させており、単純なロールバックでは問題を解決できないとしています。

DeepSeekは実際の学習に適用された2つの解決策をすでに導入しています。予測的ルーティングは、ルーティング・インデックスの計算をバックボーン・ネットワークの更新から切り離し、損失スパイクが検出されたときにのみ自動的にトリガーするもので、(約20%のオーバーヘッド)が追加されるとしています。SwiGLUクランピングは、活性値を固定範囲にクランプすることで異常を直接抑制します。レポートでは、どちらのアプローチも有効だと述べつつ、「基礎となる原理は十分に理解されていないままだ」と認めています。

以前にMeta AIやOpenAIで働いていたGoogle DeepMindの研究者であるSusan Zhangは、学習データを倍にしたことで引き起こされた不安定性が「遅れを説明する」とコメントしました。彼女は、その2つの解決策を「応急処置」と表現しながらも、DeepSeekの技術的な透明性を認めています。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

OpenAI、AMD、Intel、NVIDIAとともにMRCネットワークプロトコルを発表。10万基以上のGPUに対応

5月6日のOpenAIの発表によると、同社はAMD、Broadcom、Intel、Microsoft、そしてNVIDIAと提携して、大規模なAIトレーニング・クラスターのGPU相互接続のためのオープンなネットワーク・プロトコルであるMultipath Reliable Connection(MRC)を立ち上げました。このプロトコルは、単一のデータ伝送を分割します。

GateNews1時間前

Hut 8の株が34%急騰、98億ドルのAIデータセンターリース案件で躍進

The Blockによると、Hut 8 Corp.の株は、同社がテキサス州ヌエセス郡でNVIDIAの計算アーキテクチャ向けに設計された人工知能データセンター・キャンパスのために98億ドル規模のリース契約を締結したことを受け、本日時間外取引で34%上昇し、107.87ドルとなった。取引はHuの最初のフェーズを表している

GateNews1時間前

クリーン・スパークのCTO:AI/HPCインフラにはビットコインマイニングよりも多くのネットワークリソースが必要

CoinDeskのインタビューによると、CleanSparkの最高技術責任者(CTO)であるテイラー・モニグは、ビットコインのマイニングからAI/HPCインフラへ移行するには、より多くの冗長性が必要で、即興性はより少なくて済むと述べた。「1つのラックのネットワークファイバーは、ビットコインのマイニング施設全体に匹敵する」モニグ

GateNews1時間前

公開企業がAI投資プラットフォームのトレジャリーアプリを取得

Foresight Newsによると、投資アプリのPublicは5月6日にAIを活用した投資プラットフォームであるTreasury Appの買収を発表した。買収金額は明らかにされていない。この取引は、現在株式、債券、さらにほかの資産も扱うPublicのAI駆動型ブローカレッジ業務を強化することを目的としている。

GateNews2時間前

MiroMind、5月12日より大中華圏でMiroThinkerサービスを停止

BlockBeatsによると、Shandaグループ創業者の陳天橋(Chen Tianqiao)によって設立されたAI研究企業MiroMindは、2026年5月12日より、中国本土、香港、マカオにおいてMiroThinkerサービス(Webおよびモバイルアプリ版)を停止する予定です。停止日と復旧の見通しについては、

GateNews2時間前

ChatGPT、Excel と Google Sheets に対応:GPT-5.5 が試算表に直接ログイン、Copilot と Gemini が三つ巴で対決

OpenAI は、ChatGPT for Excel と ChatGPT for Google Sheets のアドオン(外掛)を提供開始し、GPT-5.5 を駆動エンジンとして採用している。核心は「作業しながら説明する」こと。機能には、分析、自動で数式を書くこと、スプレッドシートのデータ更新、そして推論の過程を段階的に説明することが含まれ、ユーザーが表計算ソフト内で直接処理し、理解できるようにする。Copilot や Gemini と並んだ三角競争が展開され、企業の生産性 AI における新たな局面を示している。台湾のユーザーは AppSource/Workspace Marketplace からインストールする必要があり、あわせてデータのプライバシーと、ChatGPT Plus が必要かどうかにも注意してほしい。

ChainNewsAbmedia3時間前
コメント
0/400
コメントなし