สาระสำคัญ
OpenAI ได้เปิดตัว EVMbench ระบบทดสอบมาตรฐานใหม่ที่พัฒนาร่วมกับ Paradigm เพื่อทดสอบว่าโมเดล AI ขั้นสูงสามารถตรวจจับ แก้ไข และใช้ช่องโหว่ในสมาร์ทคอนแทรกต์ของ Ethereum ได้อย่างไร
ผลลัพธ์เบื้องต้นเผยให้เห็น “ช่องว่างการโจมตี” โดยโมเดลชั้นนำในปัจจุบันทำการโจมตีได้ดีกว่าการตรวจสอบหรือแก้ไขข้อผิดพลาดอย่างครอบคลุม — เน้นให้เห็นถึงความก้าวหน้าของ AI อย่างรวดเร็วและความเสี่ยงที่กำลังเกิดขึ้น
EVMbench อาจเปลี่ยนแนวทางมาตรฐานด้านความปลอดภัยในคริปโตเคอเรนซี ช่วยให้สามารถทำการตรวจสอบด้วย AI อย่างต่อเนื่องสำหรับทีม DeFi และให้ความมั่นใจระดับสถาบันในขณะที่ทรัพย์สินมูลค่าหลายพันล้านเคลื่อนเข้าสู่ระบบบล็อกเชน
ในจุดเปลี่ยนสำคัญของเทคโนโลยีปัญญาประดิษฐ์และบล็อกเชน OpenAI ได้เปิดตัวอย่างเป็นทางการ EVMbench ซึ่งพัฒนาร่วมกับยักษ์ใหญ่ด้านการลงทุนในคริปโต Paradigm ระบบนี้ออกแบบมาเพื่อทดสอบอย่างเข้มงวดว่าเอเจนต์ AI สามารถระบุ ใช้ช่องโหว่ และแก้ไขจุดอ่อนในระบบนิเวศ Ethereum Virtual Machine (EVM) ได้อย่างไร
ด้วยมูลค่าทรัพย์สินคริปโตเปิดเผยในระบบสมาร์ทคอนแทรกต์มากกว่า 100 พันล้านดอลลาร์ ความเสี่ยงจึงไม่เคยสูงขนาดนี้ EVMbench เป็นการเปลี่ยนแปลงเชิงรุกในการใช้ “โมเดลแนวหน้า” เพื่อป้องกัน DeFi จากภัยคุกคามทางไซเบอร์ที่ซับซ้อนขึ้นเรื่อย ๆ
แหล่งข้อมูล: openai
EVMbench ก้าวข้ามการวิเคราะห์โค้ดแบบคงที่โดยประเมินเอเจนต์ AI ในสามโหมดการทำงานที่มีความเสี่ยงสูงสุด กระบวนการ “ตรวจจับ-แก้ไข-ใช้ช่องโหว่” นี้เลียนแบบเวิร์กโฟลว์ของนักวิจัยด้านความปลอดภัยชั้นนำในโลกจริง
1. โหมดตรวจจับ (The Auditor): เอเจนต์สแกนรีโพซิทอรีโค้ดซับซ้อนเพื่อค้นหาข้อผิดพลาดที่ซ่อนอยู่ ความสำเร็จวัดจาก “การระลึก” — ความสามารถในการค้นหาปัญหาที่เป็น “ความจริงพื้นฐาน” — และรางวัลบั๊กบอนนิติสมมุติ
2. โหมดแก้ไข (The Engineer): เมื่อพบบั๊กแล้ว เอเจนต์ต้องเขียนโค้ดใหม่ ระบบจะใช้ชุดทดสอบอัตโนมัติเพื่อให้แน่ใจว่าการแก้ไขนั้นสามารถป้องกันช่องโหว่โดยไม่ทำลายฟังก์ชันเดิมของสัญญา
3. โหมดโจมตี (The Adversary): ใน sandbox ที่ปลอดภัยและแยกออกจากกัน Anvil เอเจนต์พยายามดำเนินการโจมตีแบบ end-to-end เพื่อดูดเงิน นี่เป็นการวัดความสามารถในการคิดเชิงรุกและการ “เชื่อมโยง” ข้อผิดพลาดเล็กน้อยให้กลายเป็นการละเมิดรุนแรง
แหล่งข้อมูล: openai
EVMbench ไม่ได้อิงกับปริศนาทางทฤษฎี แต่สร้างขึ้นจากคลังข้อมูลที่คัดสรรมาแล้วของ 120 ช่องโหว่รุนแรงสูง ที่รวบรวมจาก 40 การตรวจสอบเชิงมือ ข้อมูลส่วนใหญ่มาจากการแข่งขันตรวจสอบในโลกจริง (เช่น Code4rena) และกระบวนการด้านความปลอดภัยภายในของ Paradigm’s Tempo blockchain
โดยเน้นไปที่ “สมาร์ทคอนแทรกต์ที่เน้นการชำระเงิน” ระบบนี้จึงมั่นใจว่าโมเดล AI ได้รับการทดสอบในสภาพแวดล้อมที่มีความเสี่ยงสูงและเกี่ยวข้องกับโค้ดที่จัดการเงินทุนมูลค่าหลายพันล้าน
การทดสอบภายในของ OpenAI เปิดเผยความสามารถของ AI ที่เร่งตัวขึ้นอย่างน่าตกใจ ในเวลาเพียงไม่กี่เดือน โมเดลชั้นนำได้พัฒนาจากการต่อสู้กับตรรกะพื้นฐาน ไปสู่การดำเนินการโจมตีซับซ้อนหลายขั้นตอน
“ช่องว่างการโจมตี”: ที่น่าสนใจคือ เอเจนต์ในปัจจุบันทำการโจมตีได้ดีกว่าการแก้ไขหรือการตรวจจับอย่างมีนัยสำคัญ (72.2%) นักวิจัยของ OpenAI สังเกตว่า เอเจนต์ทำได้ดีเมื่อได้รับเป้าหมายชัดเจน เช่น “ระบายเงิน” แต่ต้องการการวิเคราะห์ที่ละเอียดขึ้นเพื่อจัดการกับงานที่ซับซ้อนและละเอียดอ่อน เช่น การตรวจสอบอย่างครบถ้วน
แหล่งข้อมูล: Openai
สำหรับระบบนิเวศคริปโตโดยรวม EVMbench ไม่ใช่แค่คะแนนวัดผล แต่เป็นตัวเร่งให้เกิด “Security-Left” ซึ่งเป็นแนวคิดการพัฒนาการตรวจสอบความปลอดภัยระดับสูงตั้งแต่ขั้นตอนการเขียนโค้ด แทนที่จะรอการตรวจสอบหลังการปล่อยใช้งาน
ความปลอดภัยแบบเสรี: ทีม DeFi ขนาดเล็กที่ไม่สามารถจ้างตรวจสอบด้วยตนเองมูลค่า 200,000 ดอลลาร์ สามารถใช้เอเจนต์ AI ที่ได้รับการรับรองจาก EVMbench สำหรับการตรวจสอบโค้ดอย่างต่อเนื่องและแม่นยำสูง
ความพร้อมของสถาบัน: ขณะที่ยักษ์ใหญ่อย่าง Goldman Sachs และ Franklin Templeton เข้าสู่ระบบบล็อกเชน พวกเขาต้องการ “มาตรฐานทองคำ” ของการบริหารจัดการ AI ซึ่งมาตรฐานนี้สามารถให้ได้จากการใช้ benchmark มาตรฐาน
ความท้าทายแบบสองด้าน: ด้วยการเปิดซอร์ส benchmark นี้ OpenAI และ Paradigm กำลังให้เครื่องมือแก่ “คนดี” ในการวัดและเอาชนะ “คนร้าย” พร้อมทั้งรักษากรอบความเชื่อถือ “Trusted Access for Cyber” เพื่อเฝ้าระวังความเสี่ยงที่เกิดขึ้นใหม่
แม้ว่า EVMbench จะเป็นก้าวสำคัญที่ปฏิวัติวงการ แต่ในปัจจุบันยังจำกัดอยู่ในสภาพแวดล้อมแบบ deterministic และ sandbox คาดว่าเวอร์ชันในอนาคตจะรวมถึง ความขึ้นอยู่ของหลายเชน และ MEV (Maximal Extractable Value) เพื่อจำลอง “Dark Forest” ของ mainnet Ethereum อย่างสมจริงมากขึ้น
ในขณะที่เอเจนต์ AI กำลังเปลี่ยนจาก “เขียนโค้ด” เป็น “รักษาเศรษฐกิจ” EVMbench จึงเป็นมาตรฐานสำคัญสำหรับอนาคตของการเงินแบบไร้ความเชื่อถือ
คำเตือน: ความคิดเห็นและการวิเคราะห์ในบทความนี้เป็นข้อมูลเพื่อการให้ข้อมูลเท่านั้น ไม่ใช่คำแนะนำด้านการเงิน รูปแบบทางเทคนิคและตัวชี้วัดที่กล่าวถึงอาจมีความผันผวนของตลาดและอาจไม่ให้ผลลัพธ์ตามคาด นักลงทุนควรระมัดระวัง ทำการวิจัยด้วยตนเอง และตัดสินใจตามความเสี่ยงที่ยอมรับได้ของตนเอง
เกี่ยวกับผู้เขียน: Nilesh Hembade เป็นผู้ก่อตั้งและหัวหน้าบรรณาธิการของ Coinsprobe ด้วยประสบการณ์มากกว่า 5 ปีในอุตสาหกรรมคริปโตและบล็อกเชน ตั้งแต่เปิดตัว Coinsprobe ในปี 2023 เขาให้ข้อมูลเชิงลึกรายวันผ่านการวิเคราะห์ตลาดเชิงลึก ข้อมูลบนเชน และการวิจัยเชิงเทคนิค