Згідно з повідомленнями для інвесторів, оприлюдненими 12 травня, інференційний чіп Yuntianliyifei, що розробляється, використовує архітектуру GPNPU як основну технологічну дорожню карту. Ключові технічні акценти включають універсальне програмування на рівні GPGPU, сумісне з поширеними екосистемами CUDA, оптимізовані NPU-ядра для підвищення ефективності інференсу та 3D-стековану архітектуру пам’яті, створену для збільшення пропускної здатності й зменшення затримок доступу, щоб подолати вузьке місце «memory wall».
Також компанія застосовує обчислювальну модульну архітектуру для підтримки побудови суперноди рівня стійки з масштабуванням rack-level для інференсу MoE-моделей у масштабах трильйонів і сотень трильйонів. Технологічна дорожня карта спрямована на експоненційне зниження вартості токенів і прискорення розгортання застосувань великих моделей.
Related News
OpenAI запускає програму безпеки Daybreak, трирівневу архітектуру GPT-5.5 проти Anthropic Mythos
NVIDIA оголосила про довгострокову стратегічну співпрацю з IREN, розгортаючи 5 ГВт AI-інфраструктури
Угода IREN з Nvidia сигналізує про перехід до AI на 3,4 мільярда доларів