สาระสำคัญ
OpenAI ได้เปิดตัว EVMbench ระบบทดสอบมาตรฐานใหม่ที่พัฒนาร่วมกับ Paradigm เพื่อทดสอบว่าโมเดล AI ขั้นสูงสามารถตรวจจับ แก้ไข และใช้ช่องโหว่ในสมาร์ทคอนแทรกต์ของ Ethereum ได้อย่างไร
ผลลัพธ์เบื้องต้นเผยให้เห็น “ช่องว่างการโจมตี” ซึ่งโมเดลชั้นนำในปัจจุบันทำได้ดีกว่าการตรวจสอบและแก้ไขข้อผิดพลาดอย่างครอบคลุม — เน้นให้เห็นความก้าวหน้าของ AI อย่างรวดเร็วและความเสี่ยงที่กำลังเกิดขึ้น
EVMbench อาจเปลี่ยนแนวมาตรฐานด้านความปลอดภัยในคริปโตเคอเรนซี ช่วยให้สามารถตรวจสอบความปลอดภัยด้วย AI อย่างต่อเนื่องสำหรับทีม DeFi และให้ความมั่นใจระดับสถาบันในขณะที่ทรัพย์สินมูลค่าหลายพันล้านเคลื่อนเข้าสู่เครือข่าย
ในจุดเปลี่ยนสำคัญของเทคโนโลยีปัญญาประดิษฐ์และบล็อกเชน OpenAI ได้เปิดตัว EVMbench อย่างเป็นทางการ ซึ่งพัฒนาร่วมกับยักษ์ใหญ่ด้านการลงทุนในคริปโต Paradigm ระบบนี้ออกแบบมาเพื่อทดสอบอย่างเข้มงวดว่าเอเจนต์ AI สามารถระบุ ใช้ช่องโหว่ และแก้ไขจุดอ่อนในระบบนิเวศ Ethereum Virtual Machine (EVM) ได้อย่างไร
ด้วยมูลค่าทรัพย์สินคริปโตเปิดเผยในระบบสมาร์ทคอนแทรกต์กว่า 100 พันล้านดอลลาร์ ความเสี่ยงจึงไม่เคยสูงขนาดนี้ EVMbench เป็นการเปลี่ยนแปลงเชิงรุกในการใช้ “โมเดลแนวหน้า” เพื่อป้องกัน DeFi จากภัยคุกคามทางไซเบอร์ที่ซับซ้อนขึ้นเรื่อยๆ
แหล่งข้อมูล: openai
EVMbench ก้าวข้ามการวิเคราะห์โค้ดแบบคงที่โดยประเมินเอเจนต์ AI ในสามโหมดการทำงานที่มีความเสี่ยงสูงสุด กระบวนการ “ตรวจจับ-แก้ไข-โจมตี” นี้เลียนแบบเวิร์กโฟลว์ของนักวิจัยด้านความปลอดภัยชั้นนำในโลกจริง
1. โหมดตรวจจับ (The Auditor): เอเจนต์สแกนรีโพซิทอรีโค้ดซับซ้อนเพื่อค้นหาข้อผิดพลาดที่ซ่อนอยู่ ความสำเร็จวัดจาก “การนึกถึง” — ความสามารถในการค้นหาปัญหา “ความจริงพื้นฐาน” — และรางวัลบั๊กบอนนิติสมมุติ
2. โหมดแก้ไข (The Engineer): เมื่อพบบั๊กแล้ว เอเจนต์ต้องเขียนโค้ดใหม่ ระบบจะใช้ชุดทดสอบอัตโนมัติเพื่อให้แน่ใจว่าแพทช์แก้ไขช่องโหว่โดยไม่ทำลายฟังก์ชันเดิมของสัญญา
3. โหมดโจมตี (The Adversary): ใน sandbox ที่ปลอดภัยและแยกออกจากกัน Anvil เอเจนต์พยายามดำเนินการโจมตีแบบ end-to-end เพื่อขโมยเงิน ซึ่งวัดความสามารถในการวางแผนเชิงรุกและ “เชื่อมโยง” ข้อผิดพลาดเล็กน้อยเข้าสู่การละเมิดรุนแรง
แหล่งข้อมูล: openai
EVMbench ไม่ได้อิงกับปริศนาทางทฤษฎี แต่สร้างจากคลังข้อมูลที่คัดเลือกมาแล้วของ 120 ช่องโหว่รุนแรงสูง ที่รวบรวมจาก 40 การตรวจสอบเชิงมือระดับมืออาชีพ ข้อมูลส่วนใหญ่มาจากการแข่งขันตรวจสอบจริง (เช่น Code4rena) และกระบวนการด้านความปลอดภัยภายในของ Paradigm บนบล็อกเชน Tempo
โดยเน้นไปที่ “สมาร์ทคอนแทรกต์ที่เน้นการชำระเงิน” ทำให้มั่นใจว่าโมเดล AI ได้รับการทดสอบในสภาพแวดล้อมของโค้ดที่จัดการเงินทุนมูลค่าหลายพันล้าน
การทดสอบภายในของ OpenAI เผยให้เห็นความสามารถของ AI ที่พัฒนาขึ้นอย่างรวดเร็ว ในเวลาเพียงไม่กี่เดือน โมเดลชั้นนำสามารถเปลี่ยนจากการทำงานผิดพลาดง่ายๆ ไปสู่การโจมตีซับซ้อนหลายขั้นตอน
“ช่องว่างการโจมตี”: น่าสนใจที่เอเจนต์ทำได้ดีกว่ามากในการ ใช้ช่องโหว่ (72.2%) มากกว่าการ ตรวจจับ หรือ แก้ไข นักวิจัยของ OpenAI สังเกตว่า เอเจนต์ทำได้ดีเมื่อได้รับเป้าหมายชัดเจน เช่น “ขโมยเงิน” แต่ต้องการการวิเคราะห์ที่ละเอียดขึ้นเพื่อจัดการกับงานที่ซับซ้อนและละเอียดอ่อน เช่น การตรวจสอบอย่างครบถ้วน
แหล่งข้อมูล: Openai
สำหรับระบบนิเวศคริปโตโดยรวม EVMbench ไม่ใช่แค่คะแนนวัดผล แต่เป็นตัวเร่งให้เกิด “ความปลอดภัยแบบซ้าย” ซึ่งเป็นการบูรณาการการตรวจสอบระดับสูงเข้าไปในกระบวนการเขียนโค้ด แทนที่จะรอการตรวจสอบหลังการปล่อยใช้งาน
ความปลอดภัยแบบเปิด: ทีม DeFi ขนาดเล็กที่ไม่สามารถจ้างตรวจสอบด้วยตนเองมูลค่า 200,000 ดอลลาร์ สามารถใช้เอเจนต์ AI ที่ได้รับการรับรองจาก EVMbench สำหรับการตรวจสอบโค้ดอย่างต่อเนื่องและแม่นยำสูง
ความพร้อมของสถาบัน: ขณะที่ยักษ์ใหญ่ด้านการเงินแบบดั้งเดิม เช่น Goldman Sachs และ Franklin Templeton ย้ายเข้าสู่ระบบบนเครือข่าย พวกเขาต้องการ “มาตรฐานทองคำ” ของการบริหารจัดการ AI ซึ่งมาตรฐานนี้สามารถวัดผลได้จากเกณฑ์มาตรฐาน
ความท้าทายแบบสองด้าน: ด้วยการเปิดซอร์สมาตรฐานนี้ OpenAI และ Paradigm จัดให้เครื่องมือแก่ “คนดี” เพื่อวัดและก้าวนำ “คนร้าย” พร้อมทั้งสร้างกรอบ “การเข้าถึงที่เชื่อถือได้สำหรับ Cyber” เพื่อเฝ้าระวังความเสี่ยงที่เกิดขึ้นใหม่
แม้ว่า EVMbench จะเป็นก้าวสำคัญที่ปฏิวัติวงการ แต่ในปัจจุบันยังจำกัดอยู่ในสภาพแวดล้อมแบบ deterministic และ sandbox คาดว่าเวอร์ชันในอนาคตจะรวมถึง ความขึ้นต่อกันของหลายเครือข่าย และ MEV (Maximal Extractable Value) เพื่อจำลอง “Dark Forest” ของ mainnet Ethereum อย่างสมจริงมากขึ้น
ในขณะที่เอเจนต์ AI ก้าวจาก “เขียนโค้ด” ไปสู่ “รักษาความปลอดภัยเศรษฐกิจ” EVMbench จึงเป็นมาตรฐานสำคัญสำหรับอนาคตของการเงินแบบไร้ความเชื่อถือ
คำเตือน: ความคิดเห็นและการวิเคราะห์ในบทความนี้เป็นข้อมูลเพื่อการให้ข้อมูลเท่านั้น ไม่ใช่คำแนะนำด้านการเงิน รูปแบบทางเทคนิคและตัวชี้วัดที่กล่าวถึงอาจมีความผันผวนของตลาดและอาจไม่ให้ผลลัพธ์ตามคาด นักลงทุนควรระมัดระวัง ทำการวิจัยด้วยตนเอง และตัดสินใจตามความเสี่ยงที่ยอมรับได้ของตนเอง
เกี่ยวกับผู้เขียน: Nilesh Hembade เป็นผู้ก่อตั้งและหัวหน้าบรรณาธิการของ Coinsprobe ด้วยประสบการณ์มากกว่า 5 ปีในอุตสาหกรรมคริปโตและบล็อกเชน ตั้งแต่เปิดตัว Coinsprobe ในปี 2023 เขาให้ข้อมูลเชิงลึกรายวันผ่านการวิเคราะห์ตลาดเชิงลึก ข้อมูลบนเชน และการวิจัยเชิงเทคนิค