นักวิจัย: เกณฑ์มาตรฐาน AI กระแสหลักทั้งหมดสามารถทำการจัดอันดับแบบหลอกได้ โมเดลชั้นนำได้หลีกเลี่ยงการประเมินโดยอัตโนมัติแล้ว
การวิจัยแสดงให้เห็นว่าเกณฑ์มาตรฐาน AI ที่มีอำนาจหลายรายการมีช่องโหว่ด้านความปลอดภัย ซึ่งสามารถนำไปใช้ประโยชน์ได้อย่างเป็นระบบเพื่อให้ได้คะแนนสูง ทีมวิจัยได้เปิดเผยข้อบกพร่องเชิงโครงสร้าง และพัฒนาเครื่องมือสแกน WEASEL เพื่อระบุและแก้ไขช่องโหว่เหล่านี้ โดยชี้ว่าการออกแบบการประเมินที่ไม่เหมาะสมอาจทำให้ผลลัพธ์เกิดความคลาดเคลื่อน และส่งผลกระทบต่อการประเมินความสามารถที่แท้จริงของ AI
MarketWhisper·04-10 02:20
