จากการตรวจสอบ Beating การตรวจจับ, Cursor ได้เปิดเผยเทคนิคการฝึกโมเดลชุด Composer: ใช้โมเดลรุ่นก่อนหน้าเพื่อสร้างสภาพแวดล้อมการทำงานอัตโนมัติสำหรับการเรียนรู้เสริม (RL) ของรุ่นถัดไปอย่างง่ายดาย
ในระหว่างการฝึก Composer 2, Cursor ใช้ Composer 1.5 เพื่อทำงานนี้ เรียกว่า autoinstall
การฝึก RL ต้องการสภาพแวดล้อมโค้ดที่สามารถรันได้ หากสภาพแวดล้อมไม่ดี โมเดลจะเสียเวลาไปกับการแก้บั๊กและไม่ได้เรียนรู้สิ่งใหม่ ๆ; ในกรณีสุดขีด สภาพแวดล้อมไม่สามารถรันได้เลย การใช้พลังการคำนวณทั้งรอบก็สูญเปล่า autoinstall แก้ปัญหานี้ด้วยสองขั้นตอน: ขั้นตอนแรก ตัวแทน (agent) อ่านเอกสารและการตั้งค่าของคลังโค้ด แล้วเสนอคำสั่งตรวจสอบ 10 รายการพร้อมผลลัพธ์ที่คาดหวัง; ขั้นตอนที่สอง ตัวแทนอีกคนรับคำสั่ง 3 รายการจากนั้นตั้งค่าสภาพแวดล้อมใหม่ตั้งแต่ต้นจนคำสั่งรันได้สำเร็จ ขั้นตอนที่สองสามารถลองใหม่ได้สูงสุด 5 ครั้ง หากล้มเหลวทั้งหมดจะละทิ้งสภาพแวดล้อมนั้น
ในระหว่างการตั้งค่าสภาพแวดล้อม ตัวแทนจะเติมเต็ม dependencies ที่ขาดหายไปเอง: สร้างตารางฐานข้อมูลปลอม, สร้างการตั้งค่า MinIO แทน S3, เริ่มคอนเทนเนอร์ Docker เพื่อทำหน้าที่เป็นบริการ sidecar, หรือแม้แต่สร้างภาพ placeholder บทความนี้ใช้โปรเจกต์บล็อกเชน celo-org/celo-monorepo เป็นตัวอย่างแสดงกระบวนการทั้งหมด ตัวแทนหลังจากล้มเหลวในการตั้งค่าสภาพแวดล้อมในรอบแรก ก็สร้าง mock ผู้ใช้เพื่อข้ามการตรวจสอบสิทธิ์ในรอบที่สอง สุดท้ายก็สามารถรันการทดสอบได้สำเร็จ
Composer 2 ทำคะแนน 61.7% ใน Terminal-Bench (เกณฑ์วัดความสามารถในการสร้างสภาพแวดล้อมสำหรับโมเดล) สูงกว่า Composer 1.5 ที่ได้ 47.9% เกือบ 14 จุดเปอร์เซ็นต์ Cursor ระบุแผนในอนาคตที่จะให้เวอร์ชันเก่า Composer เข้าร่วมในขั้นตอนการฝึกเพิ่มเติม รวมถึงการเตรียมข้อมูล การจัดการรัน และการปรับแต่งสถาปัตยกรรม
btc.bar.articles
สหภาพยุโรปห้ามสื่อลามกปลอมแปลงด้วย AI แบบ deepfake ในวันที่ 7 พฤษภาคม
Tether เปิดตัวโมเดล AI ทางการแพทย์ QVAC MedPsy และทำคะแนนได้ 62.62 จากเวอร์ชันที่มีพารามิเตอร์ 17 พันล้านพารามิเตอร์
B.AI API เปิดตัวโมเดลใหม่ 4 รุ่น รวมถึง GPT-5.5 Instant ภายใน 48 ชั่วโมงหลังการเปิดตัวของ OpenAI
โมเดล AI ด้านการแพทย์ของ Tether มูลค่า 1.7B ทำผลงานเหนือคู่แข่งที่ใหญ่กว่า 16 เท่าในวันนี้
การประเมินมูลค่าก่อนเข้าตลาด (Pre-IPO) ของ Anthropic พุ่งแตะ 1.2 ล้านล้านดอลลาร์ แซง OpenAI ไปแล้ว 20%
ตลาดหุ้นเกาหลีใต้พุ่งเร็วกว่า ตลาดโลก ท่ามกลางกระแสบูม AI