OpenAI 宣布推出全新 AI 超級電腦網路協議 MRC(Multipath Reliable Connection),並 đã 通过 Open Compute Project(OCP)開源釋出。這項技術由 OpenAI 與 AMD、Microsoft、NVIDIA、Intel、Broadcom 等業者共同開發,目標是解決超大型 AI 訓練叢集在 GPU 之間的資料傳輸瓶頸。
AI 訓練真正瓶頸是 GPU 之間如何溝通
OpenAI 表示,隨著 ChatGPT 每週使用人數已超過 9 億,AI 系統正逐漸成為基礎設施等級的服務。為了支撐下一代模型訓練與推論需求,OpenAI 認為不只模型本身需要進化,連網路架構都必須重新設計。
OpenAI 在技術文章中指出,大型 AI 模型訓練時,一次訓練步驟可能涉及數百萬次 GPU 間資料交換。只要其中一個傳輸延遲,就可能讓整個訓練同步停滯,導致大量 GPU 閒置。
而當 AI 超級電腦規模越來越大,網路壅塞、交換器故障、延遲抖動(jitter)等問題會急遽放大。OpenAI 認為,這也是 Stargate 超級電腦計畫中最核心的技術挑戰之一。
過去資料中心的網路架構,多數採用單一路徑傳輸(single-path)。但 MRC 最大的改變,是讓同一份資料能同時分散到數百條路徑傳輸。
MRC 是什麼?OpenAI:讓 AI 網路變自動閃避障礙物
根據 OpenAI 與 AMD 的說法,MRC 的核心概念是:
將資料拆散,同時走多條路徑
在微秒級別自動繞過故障
減少網路壅塞造成的延遲
讓 GPU 保持同步運作
AMD 形容,傳統 AI 網路像是高速公路只走單一路線,一旦塞車或事故就會影響整體進度;MRC 則像是具備即時改道能力的智慧交通系統。AMD 甚至直言:「AI 規模化真正的瓶頸已經不是 GPU 與 CPU,而是網路。」
為什麼 OpenAI 要自己設計網路協議?
這次 OpenAI 釋出的訊號非常明確:AI 競爭已經不只是模型競爭,而是整套「超級電腦基礎設施」競爭。OpenAI 在文章中提到,在 Stargate 出現之前,他們與合作夥伴已共同維護三代 AI 超級電腦。這些經驗讓 OpenAI 得出一個結論:若想在 Stargate 規模下有效使用算力,整個 stack 都必須大幅降低複雜度。其中就包含網路層。
也就是說,未來 Frontier Model 的競爭,不再只是誰有更強模型,而是誰能更有效率地讓數十萬、甚至數百萬 GPU 同步運作。
MRC 背後是 Stargate:OpenAI 的曼哈頓計畫
MRC 的背景,其實是 Stargate LLC。Stargate 是 OpenAI、SoftBank Group、Oracle Corporation 與 MGX 推動的大型 AI 基礎設施計畫,最初目標是在美國投資高達 5,000 億美元 AI 基礎設施。OpenAI 表示,目前已超過原本 10GW 的階段性目標,且最近 90 天新增超過 3GW AI 基礎設施容量。
其中位於德州 Abilene 的 Stargate 超級電腦,正是 MRC 主要部署場域之一。OpenAI 指出,MRC 已整合進最新 800Gb/s 網路介面,並在實際大型訓練叢集中運行。
這篇文章 OpenAI 公布 MRC 超級電腦網路協議!攜手輝達、AMD、微軟打造 Stargate 基礎設施 最早出現於 鏈新聞 ABMedia。
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Anthropic ra mắt Claude Dreams: Agent tự sắp xếp trí nhớ giữa các công việc, loại bỏ trùng lặp và mâu thuẫn
Anthropic tại sự kiện Code with Claude đã công bố Dreams, cho phép Claude Managed Agents tự động sắp xếp ký ức giữa nhiều phiên hội thoại, loại bỏ trùng lặp và mâu thuẫn, đồng thời cập nhật các mục cũ; xuất ra một kho ký ức đã được xử lý để có thể kiểm chứng. Giới hạn đầu vào là 100 session và 4.096 ký tự, chạy bất đồng bộ, hoàn tất trong vài phút đến vài chục phút, hỗ trợ quan sát theo thời gian thực. Bản xem trước nghiên cứu cần đăng ký; hiện chỉ hỗ trợ claude-opus-4-7 và claude-sonnet-4-6, thời điểm ra mắt chính thức vẫn chưa được xác định.
ChainNewsAbmedia1giờ trước
Anthropic “cùng” SpaceX về sức mạnh điện toán: giành trọn bộ Colossus 1 với 220.000 GPU, Claude bỏ giới hạn hạn mức
Anthropic 宣 bố hợp tác năng lực tính toán với SpaceX cho trung tâm dữ liệu Colossus 1, sẽ huy động hơn 220.000 GPU Nvidia và công suất từ 300MW trở lên. Dự kiến trong vòng 1 tháng sẽ hoàn tất triển khai toàn bộ để Anthropic sử dụng, nhằm nâng cao hiệu năng và trải nghiệm cho Claude và Code. Đồng thời nới lỏng giới hạn sử dụng mỗi 5 giờ đối với Pro/Max/Team/Enterprise, xóa giới hạn trong khung cao điểm và tăng tốc độ API Opus. Cùng lúc, hạ tầng cơ sở tại châu Á và châu Âu cũng được mở rộng; trong tương lai còn có các ý định như “tính toán AI trên quỹ đạo”, nhưng hiện chưa có hợp đồng.
ChainNewsAbmedia1giờ trước
Kỹ sư Coinbase: AI Agents có thể làm gián đoạn mô hình quảng cáo trên web
Erik Reppel, một kỹ sư tại Coinbase, cho biết các tác nhân trí tuệ nhân tạo có thể làm suy yếu một cách căn bản mô hình kinh doanh của internet vốn phụ thuộc vào quảng cáo. Theo Reppel, nền kinh tế web phụ thuộc nhiều vào doanh thu quảng cáo do người dùng tạo ra, nhưng các tác nhân AI sẽ vượt qua cơ chế đó
CryptoFrontier2giờ trước
Anthropic tăng gấp đôi giới hạn tốc độ cho Claude Code sau khi chốt thỏa thuận với SpaceX giành 300MW công suất từ không gian
Theo Odaily, Anthropic đã ký một thỏa thuận với SpaceX để tiếp cận toàn bộ năng lực tính toán của trung tâm dữ liệu Colossus 1, đảm bảo hơn 300 megawatt công suất mới và hơn 220.000 GPU NVIDIA trong vòng một tháng. Có hiệu lực ngay lập tức, các giới hạn tốc độ theo giờ năm giờ của Claude Code dành cho Pro,
GateNews2giờ trước
Nền tảng tuyển dụng AI Ethos hoàn tất vòng tài trợ Series A trị giá 22,75 triệu USD do a16z dẫn dắt vào ngày 6/5
Theo BlockBeats, nền tảng tuyển dụng AI có trụ sở tại London Ethos đã hoàn tất vòng tài trợ Series A trị giá 22,75 triệu USD vào ngày 6 tháng 5, với Andreessen Horowitz (a16z) dẫn đầu vòng và General Catalyst tham gia. Nền tảng sử dụng AI để phỏng vấn ứng viên và phân tích
GateNews4giờ trước