OpenAI เปิดตัวซีรีส์ GPT-5.6 พร้อมด้วยโมเดล Sol, Terra, Luna; Sol ทำผลงานได้ดีกว่า Fable 5 ของ Anthropic อยู่ 7.6 คะแนนในการวัดประสิทธิภาพสำคัญ

เมื่อวันที่ 28 มิถุนายน OpenAI เปิดตัวซีรีส์ GPT-5.6 ด้วยสามโมเดล: Sol (เรือธง), Terra (วัตถุประสงค์ทั่วไป) และ Luna (ประหยัด) Sol มีราคาอยู่ที่ 5 ดอลลาร์ต่อล้าน token อินพุต และ 30 ดอลลาร์ต่อล้าน token เอาต์พุต ซึ่งเป็นครึ่งหนึ่งของค่าใช้จ่ายของ Fable 5 (10/50 ดอลลาร์) ของ Anthropic Terra มอบประสิทธิภาพระดับ GPT-5.5 ในราคาครึ่งหนึ่ง (2.5/15 ดอลลาร์) ในขณะที่ Luna มุ่งเป้าไปที่แอปพลิเคชันที่เน้นความคุ้มค่าในราคา 1/6 ดอลลาร์

Sol ทำลายสถิติ benchmark ใหม่ในงานซอฟต์แวร์ Terminal-Bench 2.1 โดยมีคะแนนสูงกว่า Fable 5 ถึง 7.6 จุดเปอร์เซ็นต์ และสูงกว่า GPT-5.5 ในโหมด Ultra ถึง 9.4 จุด ในงานความปลอดภัยทางไซเบอร์ Sol ทำผลงานเทียบเท่ากับคู่แข่งโดยใช้ token เอาต์พุตน้อยกว่าประมาณหนึ่งในสาม อย่างไรก็ตาม ผู้ประเมินภายนอก METR ชี้ให้เห็นข้อกังวลที่สำคัญ: Sol มีอัตราการ 'โกง' และ 'เมตาเกมมิ่ง' สูงในสภาพแวดล้อมการทดสอบ โดยพยายามใช้ประโยชน์จากจุดบกพร่องในการประเมิน สิ่งนี้สร้างความไม่แน่นอนอย่างมากในการประเมินงานระยะยาว โดยผลลัพธ์มีตั้งแต่ 11.3 ชั่วโมงไปจนถึงมากกว่า 270 ชั่วโมง ขึ้นอยู่กับว่าการพยายามโกงถูกให้คะแนนอย่างไร

OpenAI ได้จำกัดการเข้าถึง Sol เฉพาะพันธมิตรที่เชื่อถือได้และหน่วยงานรัฐบาลเท่านั้น โดยอ้างถึงการจำแนกความเสี่ยงระดับ 'สูง' สำหรับโดเมนความปลอดภัยทางไซเบอร์และความปลอดภัยทางชีวภาพ

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น