สาระสำคัญ
OpenAI ได้เปิดตัว EVMbench ระบบทดสอบมาตรฐานใหม่ที่พัฒนาร่วมกับ Paradigm เพื่อทดสอบว่าโมเดล AI ขั้นสูงสามารถตรวจจับ แก้ไข และใช้ช่องโหว่ในสมาร์ทคอนแทรกต์ของ Ethereum ได้อย่างไร
ผลลัพธ์เบื้องต้นเผยให้เห็น “ช่องว่างการโจมตี” โดยโมเดลชั้นนำในปัจจุบันทำการโจมตีได้ดีกว่าการตรวจสอบหรือแก้ไขข้อผิดพลาดอย่างครอบคลุม — เน้นให้เห็นความก้าวหน้าของ AI อย่างรวดเร็วและความเสี่ยงที่กำลังเกิดขึ้น
EVMbench อาจเปลี่ยนแนวทางมาตรฐานด้านความปลอดภัยในคริปโตเคอเรนซี ช่วยให้สามารถทำการตรวจสอบด้วย AI อย่างต่อเนื่องสำหรับทีม DeFi และให้ความมั่นใจระดับสถาบันในขณะที่ทรัพย์สินมูลค่าหลายพันล้านเคลื่อนเข้าสู่เครือข่าย
ในจุดเปลี่ยนสำคัญของเทคโนโลยีปัญญาประดิษฐ์และบล็อกเชน OpenAI ได้เปิดตัวอย่างเป็นทางการ EVMbench ซึ่งพัฒนาร่วมกับยักษ์ใหญ่ด้านการลงทุนในคริปโต Paradigm ระบบนี้ออกแบบมาเพื่อทดสอบอย่างเข้มงวดว่าเอเจนต์ AI สามารถระบุ ใช้ช่องโหว่ และแก้ไขจุดอ่อนในระบบนิเวศ Ethereum Virtual Machine (EVM) ได้อย่างไร
ด้วยมูลค่าทรัพย์สินคริปโตในโอเพ่นซอร์สกว่า 100 พันล้านดอลลาร์ ที่ปัจจุบันได้รับการคุ้มครองโดยสมาร์ทคอนแทรกต์ ความเสี่ยงจึงไม่เคยสูงขนาดนี้มาก่อน EVMbench เป็นการเปลี่ยนแปลงเชิงรุกในการใช้ “โมเดลแนวหน้า” เพื่อป้องกัน DeFi จากภัยคุกคามทางไซเบอร์ที่ซับซ้อนขึ้นเรื่อย ๆ
แหล่งข้อมูล: openai
EVMbench ก้าวข้ามการวิเคราะห์โค้ดแบบคงที่โดยประเมินเอเจนต์ AI ในสามโหมดการทำงานที่มีความเสี่ยงสูงสุด กระบวนการ “ตรวจจับ-แก้ไข-โจมตี” นี้เลียนแบบเวิร์กโฟลว์ของนักวิจัยด้านความปลอดภัยชั้นนำในโลกจริง
1. โหมดตรวจจับ (The Auditor): เอเจนต์สแกนรีโพซิทอรีโค้ดซับซ้อนเพื่อค้นหาข้อผิดพลาดที่ซ่อนอยู่ ความสำเร็จวัดจาก “การนึกถึง” — ความสามารถในการค้นหาปัญหา “ความจริงพื้นฐาน” — และรางวัลบั๊กบอนนิติจำลอง
2. โหมดแก้ไข (The Engineer): เมื่อพบบั๊กแล้ว เอเจนต์ต้องเขียนโค้ดใหม่ ระบบจะใช้ชุดทดสอบอัตโนมัติเพื่อให้แน่ใจว่าแพทช์แก้ไขช่องโหว่โดยไม่ทำให้ฟังก์ชันเดิมของสัญญาเสียหาย
3. โหมดโจมตี (The Adversary): ใน sandbox ที่ปลอดภัยและแยกออกจากกัน Anvil เอเจนต์พยายามดำเนินการโจมตีแบบ end-to-end เพื่อระดมทุน ซึ่งวัดความสามารถในการคิดเชิงรุกและการ “เชื่อมต่อ” จุดอ่อนเล็กน้อยเป็นช่องโหว่ร้ายแรง
แหล่งข้อมูล: openai
EVMbench ไม่ได้อิงกับปริศนาทางทฤษฎี แต่สร้างจากคลังข้อมูลที่คัดสรรมาแล้วของ 120 ช่องโหว่รุนแรงสูง ที่รวบรวมจาก 40 การตรวจสอบเชิงมือ ข้อมูลส่วนใหญ่มาจากการแข่งขันตรวจสอบในโลกจริง (เช่น Code4rena) และกระบวนการด้านความปลอดภัยภายในของ Paradigm จากบล็อกเชน Tempo
โดยเน้นไปที่สมาร์ทคอนแทรกต์ที่เน้น “การชำระเงิน” ทำให้มั่นใจว่าโมเดล AI ได้รับการทดสอบในสถานการณ์ที่เกี่ยวข้องกับโค้ดที่จัดการกับเงินทุนหมุนเวียนหลายพันล้าน
การทดสอบภายในของ OpenAI เผยให้เห็นความสามารถของ AI ที่พัฒนาขึ้นอย่างน่าตกใจ ในเวลาเพียงไม่กี่เดือน โมเดลชั้นนำสามารถพัฒนาจากการทำงานกับตรรกะพื้นฐานไปสู่การดำเนินการโจมตีซับซ้อนหลายขั้นตอน
“ช่องว่างการโจมตี”: ที่น่าสนใจคือ เอเจนต์ในปัจจุบันทำงานได้ดีกว่ามากในการ ใช้ช่องโหว่ (72.2%) มากกว่าการ ตรวจจับ หรือ แก้ไข นักวิจัยของ OpenAI สังเกตว่า เอเจนต์ทำได้ดีเมื่อได้รับเป้าหมายชัดเจน เช่น “ระดมทุน” แต่ต้องการการวิเคราะห์ที่ละเอียดขึ้นเพื่อจัดการกับงานที่ซับซ้อนและละเอียดอ่อน เช่น การตรวจสอบอย่างครอบคลุม
แหล่งข้อมูล: Openai
สำหรับระบบนิเวศคริปโตโดยรวม EVMbench ไม่ใช่แค่คะแนนวัดผล แต่เป็นตัวเร่งให้เกิด “ความปลอดภัยแบบซ้าย” ซึ่งเป็นการบูรณาการการตรวจสอบระดับสูงเข้าไปในกระบวนการเขียนโค้ดโดยไม่ต้องรอการตรวจสอบหลังการใช้งาน
ความปลอดภัยแบบเสรี: ทีม DeFi ขนาดเล็กที่ไม่สามารถจ้างตรวจสอบด้วยมือราคา 200,000 ดอลลาร์ สามารถใช้เอเจนต์ AI ที่ได้รับการรับรองจาก EVMbench สำหรับการตรวจสอบโค้ดอย่างต่อเนื่องและแม่นยำสูง
ความพร้อมของสถาบัน: ขณะที่ยักษ์ใหญ่ด้านการเงินแบบดั้งเดิม เช่น Goldman Sachs และ Franklin Templeton ย้ายเข้าสู่เครือข่าย พวกเขาต้องการ “มาตรฐานทองคำ” ของการบริหารจัดการ AI ซึ่งสามารถวัดผลได้จากมาตรฐานนี้
ความท้าทายแบบสองด้าน: ด้วยการเปิดซอร์สให้เข้าถึงมาตรฐานนี้ OpenAI และ Paradigm จึงให้เครื่องมือแก่ “คนดี” ในการวัดและเอาชนะ “คนร้าย” พร้อมทั้งรักษากรอบความเชื่อถือ “Trusted Access for Cyber” เพื่อเฝ้าระวังความเสี่ยงที่เกิดขึ้นใหม่
แม้ว่า EVMbench จะเป็นก้าวสำคัญที่ปฏิวัติวงการ แต่ในปัจจุบันยังจำกัดอยู่ในสภาพแวดล้อมแบบ deterministic และ sandbox คาดว่าเวอร์ชันในอนาคตจะรวม ความขึ้นอยู่ของหลายเชน และ MEV (Maximal Extractable Value) เพื่อจำลอง “Dark Forest” ของ mainnet Ethereum อย่างสมจริงมากขึ้น
ในขณะที่เอเจนต์ AI กำลังเปลี่ยนจาก “เขียนโค้ด” เป็น “รักษาเศรษฐกิจ” EVMbench จึงเป็นมาตรฐานสำคัญสำหรับอนาคตของการเงินแบบไร้ความเชื่อถือ
คำเตือน: ความคิดเห็นและการวิเคราะห์ในบทความนี้เป็นข้อมูลเพื่อการให้ข้อมูลเท่านั้น ไม่ใช่คำแนะนำด้านการเงิน รูปแบบทางเทคนิคและตัวชี้วัดที่กล่าวถึงอาจมีความผันผวนของตลาดและอาจไม่ให้ผลลัพธ์ตามคาด นักลงทุนควรระมัดระวัง ทำการวิจัยด้วยตนเอง และตัดสินใจตามความเสี่ยงที่ยอมรับได้ของตนเอง
เกี่ยวกับผู้เขียน: Nilesh Hembade เป็นผู้ก่อตั้งและหัวหน้าบรรณาธิการของ Coinsprobe ด้วยประสบการณ์ในอุตสาหกรรมคริปโตและบล็อกเชนมากกว่า 5 ปี ตั้งแต่เปิดตัว Coinsprobe ในปี 2023 เขาให้ข้อมูลเชิงลึกรายวันผ่านการวิเคราะห์ตลาดเชิงลึก ข้อมูลบนเชน และการวิจัยเชิงเทคนิค