Google DeepMind เปิดตัวผู้ช่วยโค-นักคณิตศาสตร์ด้วย AI ซึ่งเป็นผู้ช่วยวิจัยคณิตศาสตร์แบบหลายเอเจนต์ ทำผลความแม่นยำ 47.9% บนเกณฑ์ FrontierMath Tier 4 แซงหน้าสถิติก่อนหน้าของ GPT-5.5 Pro ที่ 39.6% เมื่อวันที่ 9 พฤษภาคม ระบบสามารถแก้ได้ 23 จาก 48 โจทย์ รวมถึง 3 ข้อที่โมเดลก่อนหน้านี้ทั้งหมดแก้ไม่ได้ สร้างบน Gemini 3.1 Pro สถาปัตยกรรมใช้การออกแบบแบบลำดับชั้น โดยมีเอเจนต์ประสานงานโครงการเป็นผู้แจกจ่ายงานให้กับเอเจนต์ย่อยที่รับผิดชอบการค้นคืนวรรณกรรม การเขียนโค้ด และการให้เหตุผล พร้อมด้วยเอเจนต์ผู้ทบทวนหลายตัวที่ตรวจสอบข้อพิสูจน์ก่อนส่ง

Epoch AI ดำเนินการทดสอบแบบไม่เปิดเผย (blind testing) ทำให้ทีมของ DeepMind ไม่สามารถเห็นโจทย์ได้ โดยให้เวลาการคำนวณต่อคำถามสูงสุด 48 ชั่วโมง ในการใช้งานจริง นักคณิตศาสตร์ Marc Lackenby ใช้ระบบเพื่อยุติข้อคาดเดาแบบเปิดจาก Kourovka Notebook แสดงให้เห็นมูลค่าการวิจัยในทางปฏิบัติ ปัจจุบันระบบพร้อมให้ใช้งานกับนักคณิตศาสตร์จำนวนจำกัดในช่วงทดสอบเบต้า

news.view.source

news.article.disclaimer

news.related.news

05-09 09:54

ระบบให้รางวัลของ OpenAI โดยไม่ตั้งใจให้คะแนน Thinking Chains บน 6 โมเดล รวมถึง GPT-5.4

05-09 05:53

Google จะกำหนดให้ใช้ AI ในการสัมภาษณ์โค้ด พร้อมเปิดตัวการจ้างงานที่ขับเคลื่อนด้วย Gemini ภายในปลายปีนี้

05-09 05:53

China Mobile เปิดตัวแพลตฟอร์มโมเดล AI พร้อมการบูรณาการมากกว่า 300 รายการ ลดต้นทุนโทเค็นลง 30%

05-08 14:41

SwarmBase ผสานรวมเอเจนต์ AIDEN ของ IQ AI เมื่อวันที่ 7 พฤษภาคม

05-08 06:52