OpenAI が MRC スーパコンピュータ ネットワーク プロトコルを公開!NVIDIA、AMD、Microsoft と協力して Stargate の基盤インフラを構築

ChainNewsAbmedia

OpenAI は、新しい AI 超スーパーコンピュータ ネットワーク プロトコル MRC(Multipath Reliable Connection)を発表し、Open Compute Project(OCP)を通じてオープンソースとして公開した。 この技術は OpenAI と AMD、Microsoft、NVIDIA、Intel、Broadcom などの企業が共同で開発しており、超大型 AI 学習クラスタにおける GPU 間のデータ伝送のボトルネックを解消することを目的としている。

AI 学習の本当のボトルネックは、GPU 間でどうやって連携するか

OpenAI は、ChatGPT の毎週の利用者数がすでに 9 億人を超え、AI システムが次第にインフラ級のサービスになりつつあると述べている。 次世代モデルの学習と推論の需要を支えるために、OpenAI は、モデルそのものだけでなく、ネットワーク アーキテクチャも再設計する必要があると考えている。

OpenAI は技術記事の中で、大規模 AI モデルの学習では、1 回の学習ステップに数百万回の GPU 間データ交換が関わる可能性があると指摘している。 そのうちのどれか 1 つでも伝送の遅延が起きれば、学習全体の同期が停止してしまい、多数の GPU が遊休状態になる。

そして AI 超スーパーコンピュータの規模がますます大きくなるにつれ、ネットワークの輻輳、スイッチの故障、遅延のジッター(jitter)などの問題が急速に拡大する。 OpenAI は、これが Stargate 超スーパーコンピュータ計画における最も核心的な技術課題の 1 つだと考えている。

過去のデータセンターでは、ネットワーク アーキテクチャの多くが単一経路伝送(single-path)を採用していた。 しかし MRC の最大の変化は、同じデータを数百本の経路伝送に同時に分散できるようにした点だ。

MRC とは何か? OpenAI:AI ネットワークを自動で障害物回避させる

OpenAI と AMD の説明によれば、MRC の中核となる概念は次のとおり。

データを分割し、同時に複数の経路を通す

マイクロ秒レベルで故障を自動的に回避する

ネットワークの輻輳が引き起こす遅延を抑える

GPU が同期した状態で動き続けられるようにする

AMD は、従来の AI ネットワークは高速道路が 1 車線だけで動いているようなもので、渋滞や事故が起きれば全体の進行に影響するのに対し、MRC はリアルタイムで迂回できる能力を備えたスマート交通システムだと述べた。 AMD はさらに、「AI の規模化における本当のボトルネックは、GPU と CPU ではなくネットワークだ」とまで断言している。

なぜ OpenAI は自らネットワーク プロトコルを設計するのか?

今回 OpenAI が出したシグナルは非常に明確だ。 AI 競争は、もはやモデル同士の競争だけではなく、「スーパーコンピュータのインフラ」一式の競争になっている。 OpenAI は記事の中で、Stargate が登場する前には、彼らがパートナーとともに 3 世代目の AI 超スーパーコンピュータを共同で維持していたと述べている。 こうした経験から OpenAI は結論に至った。 Stargate 規模で算力を効果的に使うには、スタック全体の複雑さを大幅に下げる必要があり、その中にはネットワーク層も含まれる、ということだ。

つまり、将来の Frontier Model の競争は、「誰がより強いモデルを持つか」だけではなく、「数十万、さらには数百万の GPU を同期運用できるように、より効率的に動かせるか」が勝負になる。

MRC の背後には Stargate:OpenAI のマンハッタン計画

MRC の背景には、実際には Stargate LLC がある。 Stargate は OpenAI、SoftBank Group、Oracle Corporation、MGX が推進する大規模な AI 基盤インフラ計画で、当初の目標は、米国に高達 5,000 億ドルの AI 基盤インフラに投資することだった。 OpenAI によれば、現在は当初の 10GW の段階目標をすでに上回っており、直近 90 日で 3GW 以上の AI 基盤インフラ容量が新たに追加されたという。

テキサス州 Abilene にある Stargate 超スーパーコンピュータは、MRC の主要な導入先の 1 つだ。 OpenAI は、MRC が最新の 800Gb/s ネットワーク インターフェースに統合されており、実際の大規模学習クラスタで運用されていると指摘している。

この文章は OpenAI が MRC 超スーパーコンピュータ ネットワーク プロトコルを公開!NVIDIA、AMD、マイクロソフトとともに Stargate 基盤インフラを構築 という内容で、最初に 鏈新聞 ABMedia に掲載された。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

リード・ホフマン: NFTは、AIエージェントが暗号の信頼を必要とすることで再び戻ってくるかもしれない

ライド・ホフマンは、GreylockのパートナーでありLinkedInの共同創業者だが、自律エージェントは、オープンなインターネットをまたいで取引するために暗号ベースの信頼システムを必要とするだろうと述べ、彼の発言によれば、NFTが再び脚光を浴びる可能性があるとのことだ。 AIエージェントと信頼インフラストラクチャ ホフマンの発言は、潜在的な

CryptoFrontier46分前

Scale AIはAIデータ処理のための$500M ペンタゴン契約を受領

ChainCatcherによると、米国国防総省はMeta Platformsに支援されるScale AIに対し、データ処理と軍事上の意思決定を支援するための5億ドルの契約を授与した。この受賞は、サンフランシスコ拠点の同社がこれまでに受け取った1億ドルの契約の5倍の規模だ。同社が受け取った契約はさらに続く。

GateNews1時間前

イーロン・マスクのxAIは、独立企業としてのステータスが終了することに伴い、SpaceXAIに改ブランドする

Odailyによると、イーロン・マスクは、xAIをSpaceXAIに改名すると発表しました。企業はもはや独立した組織として運営されないためです。

GateNews1時間前

IBMはThink 2026で新しいエージェント型ツールによりエンタープライズAIスイートを拡充

IBMによると、同社はボストンで開催されたThink 2026カンファレンスにおいて、エンタープライズAI機能の拡張を発表し、組織が人工知能を日々の業務に組み込めるよう支援する新しいエージェントベースのツールを導入した。現在一般提供中のContext Studioは、企業が

GateNews2時間前

Hut 8の株がAIデータセンターのリース$9.8Bで30%急騰

Hut 8の株価は、98億ドルのAIデータセンター賃貸契約に関するニュースを受けて30%超急騰した。ビットコインのマイナーは、テキサスにある長期のハイパースケール契約によってAIインフラへと拡大している。 AIインフラ拡張 その契約には、合計を増やし得るオプションが含まれている

CryptoFrontier2時間前
コメント
0/400
コメントなし