Fable 5 พลาดทุกงานที่ยากที่สุดในการสอบ UC Berkeley ALE ฉบับนี้ ใช้ต้นทุนมากกว่าคู่แข่ง 4-12 เท่า

2026-06-12 11:01:40

ตามรายงานของ UC Berkeley RDI ผลการประเมิน Agents' Last Exam (ALE) ล่าสุดที่เผยแพร่ในสัปดาห์นี้แสดงอัตราความสำเร็จ 0% สำหรับงานที่ยากที่สุดซึ่งต้องใช้การให้เหตุผลอย่างต่อเนื่องและความเชี่ยวชาญระดับลึกในบรรดาตัวแทน AI ทุกตัวที่ทดสอบ รวมถึง Fable 5 ที่เพิ่งเปิดตัว ในต้นทุน API ต่อรายการงาน Fable 5 เรียกเก็บ 15.70 ดอลลาร์—สูงกว่า GPT-5.5 ที่ 3.80 ดอลลาร์ถึง 4 เท่า และสูงกว่า Composer 2.5 ที่ 1.33 ดอลลาร์ถึง 12 เท่า การประเมินครอบคลุม 55 สายอาชีพ โดยมีมากกว่า 1,500 งานที่ผู้เชี่ยวชาญยืนยันแล้ว และพบว่าโดยทั่วไปตัวแทนมักล้มเหลวโดยประกาศความสำเร็จก่อนกำหนดโดยไม่ตรวจสอบผลลัพธ์อย่างถูกต้อง

news.view.source

news.article.disclaimer

news.related.news

2 ชั่วโมง ที่แล้ว

Claude Fable 5 ของ Anthropic ระบุบัญชีฉ้อโกงที่เชื่อมโยงกับบริษัท AI ของจีน จำนวน 24,000 บัญชี

2 ชั่วโมง ที่แล้ว

Claude Fable 5 ถูกเจาะระบบภายใน 48 ชั่วโมงหลังเปิดตัว ข้อความพรอมป์ต์ของระบบรั่วบน GitHub

5 ชั่วโมง ที่แล้ว

ค่าใช้จ่ายของ Anthropic Fable 5 มากกว่า DeepSeek V4 Pro ถึง 50 เท่าต่อ 1 โทเค็น

10 ชั่วโมง ที่แล้ว

Morgan Stanley คาดว่าเมมโมรีชิปจะเข้าสู่ซูเปอร์ไซเคิลยาวไปเกินปลายปี 2026 โดยมีแรงหนุนจากความต้องการด้าน AI

17 ชั่วโมง ที่แล้ว