Mistral เปิดตัว Leanstral 1.5 สำหรับการพิสูจน์อย่างเป็นทางการ ลดต้นทุนเหลือประมาณ 4 ดอลลาร์ต่อปัญหา

ตาม OneMillion_AI, Mistral AI เพิ่งปล่อย Leanstral 1.5 ซึ่งเป็นแบบจำลองการพิสูจน์เชิงรูปนัยสำหรับ Lean 4 ที่มีพารามิเตอร์ทั้งหมด 119 พันล้านพารามิเตอร์และพารามิเตอร์ที่ทำงานอยู่ 65 พันล้านพารามิเตอร์ แบบจำลองนี้เผยแพร่ภายใต้ลิขสิทธิ์ Apache-2.0 พร้อมการเข้าถึง API ฟรี สำหรับ PutnamBench, Leanstral 1.5 มีต้นทุนเฉลี่ยประมาณ 4 ดอลลาร์ต่อปัญหาที่แก้ได้ ซึ่งต่ำกว่าระบบก่อนหน้านี้อย่างมีนัยสำคัญ ซึ่งมีต้นทุนหลักสิบถึงหลักร้อยดอลลาร์ต่อปัญหา

แบบจำลองแก้ปัญหา 587 จาก 672 ปัญหาของ PutnamBench และทำคะแนน 87% ในเกณฑ์มาตรฐานพีชคณิตนามธรรม FATE-H และ 34% ใน FATE-X ซึ่งสร้างสถิติประสิทธิภาพใหม่สำหรับหมวดหมู่ของมัน นอกเหนือจากการพิสูจน์ทางคณิตศาสตร์ Leanstral 1.5 ยังถูกนำไปใช้ในการตรวจสอบโค้ด โดยค้นพบจุดบกพร่องจริง 11 จุดจาก 57 คลังข้อมูล Rust แบบโอเพนซอร์ส โดย 5 รายการไม่เคยถูกรายงานมาก่อน

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น