OpenAI публікує протокол MRC для суперкомп’ютерної мережі! Разом із Nvidia, AMD та Microsoft створюють базову інфраструктуру Stargate

OpenAI оголосила про запуск нового протоколу AI «суперкомп’ютерної» мережі MRC (Multipath Reliable Connection) і вже відкрила його через Open Compute Project (OCP). Цю технологію спільно розробляють OpenAI та такі компанії, як AMD, Microsoft, NVIDIA, Intel, Broadcom тощо; мета — усунути вузьке місце з передаванням даних між GPU у надвеликих AI-тренувальних кластерах.

AI-тренування — справжня проблема не в GPU, а в тому, як вони спілкуються між собою

OpenAI зазначає, що, оскільки щотижневе використання ChatGPT уже перевищило 900 млн користувачів, AI-системи поступово перетворюються на сервіс рівня базової інфраструктури. Щоб підтримати потреби в тренуванні та виведенні наступних моделей, OpenAI вважає, що має еволюціонувати не лише сама модель — мережеву архітектуру також потрібно перерозробити.

У технічній статті OpenAI підкреслює: під час тренування великих AI-моделей один крок тренування може включати мільйони обмінів даними між GPU. Якщо затримка з’являється в одному з передавань, це може спричинити повну зупинку синхронізації всього тренування, через що значна кількість GPU простоюватиме.

А коли масштаби AI-суперкомп’ютера стають більшими, проблеми на кшталт мережевої перевантаженості, відмов комутаторів і «jitter» (дрижання затримки) стрімко посилюються. OpenAI вважає, що це — один із ключових технічних викликів у межах проєкту Stargate.

Раніше мережева архітектура дата-центрів здебільшого використовувала одношляхове передавання (single-path). Але головна зміна MRC полягає в тому, що один і той самий потік даних може одночасно розподілятися на сотні шляхів передавання.

Що таке MRC? OpenAI: зробити AI-мережі здатними автоматично «обходити перешкоди»

За даними OpenAI та AMD, ключові принципи MRC такі:

ділити дані на частини та одночасно прокладати їх кількома шляхами на автоматі обходити відмови на рівні мікросекунд зменшувати затримки, спричинені мережевою перевантаженістю підтримувати синхронну роботу GPU

AMD описує, що традиційна AI-мережа схожа на автостраду, яка рухається лише одним маршрутом: якщо виникає затор або аварія, це впливає на весь прогрес; натомість MRC — це інтелектуальна транспортна система з можливістю миттєвого перерозподілу маршрутів. AMD навіть заявляє: «Справжнім вузьким місцем під час масштабування AI є не GPU та CPU, а мережа».

Чому OpenAI вирішила самостійно проєктувати мережевий протокол

Сигнал цього разу від OpenAI дуже чіткий: AI-конкуренція — це вже не лише конкуренція моделей, а конкуренція цілого комплексу «інфраструктури суперкомп’ютера». У статті OpenAI згадується, що до появи Stargate вони разом із партнерами вже спільно підтримували три покоління AI-суперкомп’ютерів. Ці практичні напрацювання привели OpenAI до висновку: щоб ефективно використовувати обчислювальну потужність у масштабі Stargate, весь stack потрібно суттєво спрощувати — і це також стосується мережевого рівня.

Інакше кажучи, майбутня конкуренція Frontier Model — це вже не лише хто створить сильнішу модель, а хто зможе ефективніше синхронізувати роботу десятків і навіть сотень тисяч GPU.

За MRC стоїть Stargate: «мангеттенський проєкт» OpenAI

Передумовою MRC є Stargate LLC. Stargate — це ініціатива з розвитку великої AI-інфраструктури за участі OpenAI, SoftBank Group, Oracle Corporation та MGX; спочатку її метою було інвестувати в США до 500 млрд доларів в AI-інфраструктуру. OpenAI зазначає, що наразі вони вже перевищили проміжну ціль у 10GW, а протягом останніх 90 днів додали понад 3GW потужності AI-інфраструктури.

Суперкомп’ютер Stargate у місті Абілен, штат Техас, є одним із ключових майданчиків для розгортання MRC. OpenAI вказує, що MRC інтегровано в найновіший мережевий інтерфейс на 800Gb/s, і що його вже тестують у реальних великих тренувальних кластерах.

Ця стаття «OpenAI оприлюднила MRC — суперкомп’ютерний мережевий протокол!» уперше з’явилася на сайті Ланцюжок новин ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Рейд Гоффман: NFT можуть повернутися, оскільки AI-агентам потрібна криптографічна довіра

Рейд Гофман, партнер у Greylock і співзасновник LinkedIn, заявив, що автономним агентам знадобляться крипто-орієнтовані системи довіри, щоб здійснювати транзакції через відкритий інтернет, припустивши, що NFT можуть повернутися, про це свідчить його заява. AI-агенти та інфраструктура довіри Висловлювання Гофмана вказують на потенціал

CryptoFrontier46хв. тому

Scale AI отримала контракт Пентагону $500M на обробку даних для ШІ

Згідно з ChainCatcher, Міністерство оборони США надало Scale AI, яку підтримує Meta Platforms, контракт на 500 мільйонів доларів для обробки даних і підтримки військового ухвалення рішень. Нагорода у п’ять разів більша за контракт на 100 мільйонів доларів, який компанія з Сан-Франциско отримала раніше в

GateNews1год тому

xAI Ілона Маска перейменують на SpaceXAI після завершення статусу незалежної компанії

Згідно з Odaily, Ілон Маск оголосив, що xAI буде перейменовано на SpaceXAI, оскільки компанія більше не працюватиме як незалежна структура.

GateNews1год тому

IBM розширює набір Enterprise AI Suite новими інструментами на базі агентів на Think 2026

Згідно з IBM, компанія оголосила про розширення своїх можливостей корпоративного ШІ на конференції Think 2026 у Бостоні, запустивши нові інструменти на основі агентів, щоб допомогти організаціям вбудовувати штучний інтелект у щоденну діяльність. Context Studio, який уже доступний загалом, дає змогу підприємствам

GateNews2год тому

Акції Hut 8 зросли на 30% на тлі оренди дата-центру з AI на $9,8 млрд

Hut 8 акції зросли більш ніж на 30% після новини про угоду з оренди AI дата-центру на 9,8 мільярда доларів. Біткоїн-майнер розширюється в AI-інфраструктуру з довгостроковим контра́ктом гіпермасштабу, розташованим у Техасі. AI-інфраструктурне розширення Контракт містить опції, які можуть збільшити загальну кількість

CryptoFrontier2год тому
Прокоментувати
0/400
Немає коментарів