Theo các công bố quan hệ nhà đầu tư vào ngày 12/5, chip suy luận đang phát triển của Yuntianliyifei áp dụng kiến trúc GPNPU làm công nghệ cốt lõi trong lộ trình. Các điểm nhấn kỹ thuật chính bao gồm khả năng lập trình vạn năng ở mức GPGPU, tương thích với hệ sinh thái CUDA phổ biến, các lõi NPU được tối ưu cho hiệu suất suy luận và kiến trúc bộ nhớ xếp chồng 3D nhằm tăng băng thông và giảm độ trễ truy cập, vượt qua nút thắt cổ chai “bức tường bộ nhớ”.
Công ty cũng triển khai kiến trúc mô-đun tính toán để hỗ trợ xây dựng siêu nút mở rộng theo cấp rack, phục vụ suy luận các mô hình MoE quy mô nghìn tỷ và hàng trăm nghìn tỷ. Lộ trình công nghệ đặt mục tiêu giảm chi phí token theo cấp số nhân và đẩy nhanh triển khai ứng dụng cho các mô hình lớn.
Related News
OpenAI ra mắt chương trình an ninh mạng Daybreak, kiến trúc ba lớp của GPT-5.5 đối đầu Anthropic Mythos
NVIDIA công bố hợp tác chiến lược dài hạn với IREN, triển khai hạ tầng AI 5 gigawatt
Thỏa thuận với Nvidia của IREN báo hiệu bước chuyển hướng AI trị giá 3,4 tỷ USD