ตามเอกสารเปิดเผยแก่นักลงทุน (investor relations) เมื่อวันที่ 12 พฤษภาคม ชิปอินเฟอเรนซ์ที่ Yuntianliyifei กำลังพัฒนานั้นใช้สถาปัตยกรรม GPNPU เป็นแกนหลักของแผนงานเทคโนโลยี ไฮไลต์ด้านเทคนิคที่สำคัญได้แก่ ความสามารถในการโปรแกรมสากลระดับ GPGPU ที่รองรับระบบนิเวศ CUDA กระแสหลัก การปรับแต่งคอร์ NPU เพื่อเพิ่มประสิทธิภาพด้านอินเฟอเรนซ์ และสถาปัตยกรรมหน่วยความจำแบบซ้อน 3D ที่ออกแบบมาเพื่อเพิ่มแบนด์วิดท์และลดเวลาแฝงในการเข้าถึง โดยทะลุผ่านคอขวดปัญหา “memory wall”
บริษัทฯ ยังใช้สถาปัตยกรรมแบบโมดูลาร์สำหรับการคำนวณ เพื่อรองรับการสร้างซูเปอร์โหนดขนาดระดับแร็คสำหรับการเร่งขยายการทำงานของโมเดล MoE ระดับล้านล้านและร้อยล้านล้านพารามิเตอร์สำหรับการอินเฟอเรนซ์ แผนงานเทคโนโลยีมุ่งเป้าลดต้นทุนต่อโทเคนแบบทวีคูณ และเร่งการนำโมเดลขนาดใหญ่ไปประยุกต์ใช้งานอย่างรวดเร็ว
news.related.news
OpenAI เปิดตัวแผนงานด้านความปลอดภัย Daybreak โดยสถาปัตยกรรมแบบ 3 ชั้นของ GPT-5.5 เพื่อต่อสู้กับ Anthropic Mythos
NVIDIA ประกาศความร่วมมือเชิงกลยุทธ์ระยะยาวกับ IREN วางแผนพัฒนาโครงสร้างพื้นฐานด้าน AI ขนาด 5 กิกะวัตต์
ข้อตกลงของ IREN กับ Nvidia ส่งสัญญาณการปรับเปลี่ยนสู่ AI มูลค่า 3.4 พันล้านดอลลาร์