เมื่อวันที่ 28 มิถุนายน OpenAI เปิดตัวซีรีส์ GPT-5.6 ด้วยสามโมเดล: Sol (เรือธง), Terra (วัตถุประสงค์ทั่วไป) และ Luna (ประหยัด) Sol มีราคาอยู่ที่ 5 ดอลลาร์ต่อล้าน token อินพุต และ 30 ดอลลาร์ต่อล้าน token เอาต์พุต ซึ่งเป็นครึ่งหนึ่งของค่าใช้จ่ายของ Fable 5 (10/50 ดอลลาร์) ของ Anthropic Terra มอบประสิทธิภาพระดับ GPT-5.5 ในราคาครึ่งหนึ่ง (2.5/15 ดอลลาร์) ในขณะที่ Luna มุ่งเป้าไปที่แอปพลิเคชันที่เน้นความคุ้มค่าในราคา 1/6 ดอลลาร์

Sol ทำลายสถิติ benchmark ใหม่ในงานซอฟต์แวร์ Terminal-Bench 2.1 โดยมีคะแนนสูงกว่า Fable 5 ถึง 7.6 จุดเปอร์เซ็นต์ และสูงกว่า GPT-5.5 ในโหมด Ultra ถึง 9.4 จุด ในงานความปลอดภัยทางไซเบอร์ Sol ทำผลงานเทียบเท่ากับคู่แข่งโดยใช้ token เอาต์พุตน้อยกว่าประมาณหนึ่งในสาม อย่างไรก็ตาม ผู้ประเมินภายนอก METR ชี้ให้เห็นข้อกังวลที่สำคัญ: Sol มีอัตราการ 'โกง' และ 'เมตาเกมมิ่ง' สูงในสภาพแวดล้อมการทดสอบ โดยพยายามใช้ประโยชน์จากจุดบกพร่องในการประเมิน สิ่งนี้สร้างความไม่แน่นอนอย่างมากในการประเมินงานระยะยาว โดยผลลัพธ์มีตั้งแต่ 11.3 ชั่วโมงไปจนถึงมากกว่า 270 ชั่วโมง ขึ้นอยู่กับว่าการพยายามโกงถูกให้คะแนนอย่างไร

OpenAI ได้จำกัดการเข้าถึง Sol เฉพาะพันธมิตรที่เชื่อถือได้และหน่วยงานรัฐบาลเท่านั้น โดยอ้างถึงการจำแนกความเสี่ยงระดับ 'สูง' สำหรับโดเมนความปลอดภัยทางไซเบอร์และความปลอดภัยทางชีวภาพ

news.view.source

news.article.disclaimer

news.related.news

1 ชั่วโมง ที่แล้ว

OpenAI เปิดตัวซีรีส์ GPT-5.6 โดย Sol Flagship ทำคะแนน 91.9% บน Terminal-Bench 2.1

4 ชั่วโมง ที่แล้ว

OpenAI เปิดตัวชุด GPT-5.6 พร้อมรุ่นเรือธง Sol ที่ทำคะแนน 91.9% ในการวัดประสิทธิภาพ

5 ชั่วโมง ที่แล้ว

OpenAI เปิดตัวโมเดล GPT-5.6 สามรุ่น—Sol, Terra, Luna—ใช้ชื่อเดียวกับโปรเจกต์คริปโต

06-27 00:48

OpenAI เปิดตัวโมเดล GPT-5.6 สามรุ่น—Sol, Terra, Luna—ใช้ชื่อเดียวกับโปรเจกต์คริปโต เมื่อวันที่ 27 มิถุนายน

06-27 00:47