Согласно раскрытиям для отношений с инвесторами от 12 мая, разрабатываемый инференс-чип Yuntianliyifei использует архитектуру GPNPU в качестве основной технологической дорожной карты. Ключевые технические моменты включают универсальную программируемость на уровне GPGPU, совместимую с распространённой экосистемой CUDA, оптимизированные NPU-ядра для повышения эффективности инференса, а также 3D-стековую архитектуру памяти, предназначенную для увеличения пропускной способности и снижения задержек доступа, что позволяет прорваться через узкое место «стена памяти».
Компания также применяет модульную архитектуру вычислений, чтобы поддерживать масштабирование до уровня стоек при строительстве супернод для инференса MoE-моделей масштаба триллион и сотни триллионов. Технологическая дорожная карта нацелена на экспоненциальное снижение стоимости токенов и ускорение развёртывания приложений больших моделей.