Google Cloud เปิดตัวโมเดล Gemini 3.2 Flash Lite โดยมีค่าใช้จ่ายในการอนุมานต่ำกว่า GPT-5.5 ถึง 95%

จากการติดตามของ Beating.AI พบว่าตัวเลือกโมเดลใหม่ชื่อ gemini-3.2-flash-lite-live-preview ได้ปรากฏอยู่ในรายการการเลือกรุ่นของ Google Cloud แล้ว ณ วันที่ 17 พฤษภาคม โดยคำต่อท้าย “lite” และ “live” สื่อว่า Google กำลังพัฒนารุ่นเฉพาะที่ปรับให้เหมาะกับการโต้ตอบแบบเรียลไทม์ที่มีความหน่วงต่ำมาก

ก่อนหน้านี้ Abacus.AI CEO อย่าง Bindu Reddy เปิดเผยว่า Gemini 3.2 Flash ทำประสิทธิภาพได้ถึง 92% ของความสามารถด้านการเขียนโค้ดและการให้เหตุผลของ GPT-5.5 ขณะเดียวกันยังคงต้นทุนการอินเฟอเรนซ์ไว้เพียง 1/20 ของ GPT-5.5 โดยคำถามส่วนใหญ่จะได้คำตอบภายในเวลาต่ำกว่า 200 มิลลิวินาที ผู้สังเกตการณ์ในอุตสาหกรรมคาดว่าโมเดลน้ำหนักเบาที่เน้นลดต้นทุนตัวนี้จะถูกเปิดตัวอย่างเป็นทางการในงาน Google I/O วันที่ 20 พฤษภาคม

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น