Google DeepMind AI ร่วมเป็นโค-นักคณิตศาสตร์ ทำคะแนน 47.9% บน FrontierMath Tier 4 เอาชนะ GPT-5.5 Pro และแก้ปัญหาที่เคยแก้ไม่ได้มาก่อน 3 ข้อ

Google DeepMind เปิดตัวผู้ช่วยโค-นักคณิตศาสตร์ด้วย AI ซึ่งเป็นผู้ช่วยวิจัยคณิตศาสตร์แบบหลายเอเจนต์ ทำผลความแม่นยำ 47.9% บนเกณฑ์ FrontierMath Tier 4 แซงหน้าสถิติก่อนหน้าของ GPT-5.5 Pro ที่ 39.6% เมื่อวันที่ 9 พฤษภาคม ระบบสามารถแก้ได้ 23 จาก 48 โจทย์ รวมถึง 3 ข้อที่โมเดลก่อนหน้านี้ทั้งหมดแก้ไม่ได้ สร้างบน Gemini 3.1 Pro สถาปัตยกรรมใช้การออกแบบแบบลำดับชั้น โดยมีเอเจนต์ประสานงานโครงการเป็นผู้แจกจ่ายงานให้กับเอเจนต์ย่อยที่รับผิดชอบการค้นคืนวรรณกรรม การเขียนโค้ด และการให้เหตุผล พร้อมด้วยเอเจนต์ผู้ทบทวนหลายตัวที่ตรวจสอบข้อพิสูจน์ก่อนส่ง

Epoch AI ดำเนินการทดสอบแบบไม่เปิดเผย (blind testing) ทำให้ทีมของ DeepMind ไม่สามารถเห็นโจทย์ได้ โดยให้เวลาการคำนวณต่อคำถามสูงสุด 48 ชั่วโมง ในการใช้งานจริง นักคณิตศาสตร์ Marc Lackenby ใช้ระบบเพื่อยุติข้อคาดเดาแบบเปิดจาก Kourovka Notebook แสดงให้เห็นมูลค่าการวิจัยในทางปฏิบัติ ปัจจุบันระบบพร้อมให้ใช้งานกับนักคณิตศาสตร์จำนวนจำกัดในช่วงทดสอบเบต้า

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น