การตรวจสอบ AI เข้าสู่การปฏิบัติจริง OpenAI เปิดตัว EVMbench เสริมความแข็งแกร่งในการประเมินความปลอดภัยของสมาร์ทคอนแทรกต์

ETH-3.82%
WELL-4.47%

OpenAI ร่วมมือกับ Paradigm เปิดตัว EVMbench ทดสอบความสามารถในการโจมตีและป้องกันสัญญาอัจฉริยะบน EVM เผยความกังวลเกี่ยวกับจุดอ่อนและความแข็งแกร่งของการโจมตี

เน้นการทดสอบในสภาพแวดล้อมทางเศรษฐกิจ OpenAI ร่วมกับ Paradigm เสริมความปลอดภัยบนบล็อกเชน

ผู้นำด้านปัญญาประดิษฐ์ OpenAI ประกาศความร่วมมือกับบริษัทลงทุนในคริปโตเคอเรนซีชื่อดัง Paradigm และบริษัทด้านความปลอดภัย OtterSec เปิดตัวเครื่องมือทดสอบมาตรฐาน EVMbench ซึ่งออกแบบมาเพื่อประเมินประสิทธิภาพของ AI ตัวแทน (AI Agents) ในด้านความปลอดภัยของสัญญาอัจฉริยะบน Ethereum Virtual Machine (EVM)

ด้วยการบูรณาการอย่างลึกซึ้งระหว่าง AI กับเทคโนโลยีคริปโต สัญญาอัจฉริยะกลายเป็นโครงสร้างพื้นฐานสำคัญในการจัดการสินทรัพย์คริปโตเปิดจำนวนมากกว่า 1,000 พันล้านดอลลาร์ การเปิดตัวเครื่องมือนี้เป็นสัญญาณว่าอุตสาหกรรมเริ่มให้ความสนใจต่อความสามารถของ AI ในสภาพแวดล้อมที่มีความหมายทางเศรษฐกิจ

ทีมงาน OpenAI ชี้ว่า ด้วยความก้าวหน้าของ AI ตัวแทนในด้านการเขียนและวางแผนโค้ด ในอนาคตโมเดลเหล่านี้จะมีบทบาทเปลี่ยนแปลงทั้งด้านการโจมตีและการป้องกันบนบล็อกเชน ดังนั้น การสร้างมาตรฐานการประเมินผลจึงเป็นสิ่งสำคัญในการติดตามความก้าวหน้าของ AI

การทดสอบเชิงลึกใน 3 โหมด พร้อม 120 ช่องโหว่จากการตรวจสอบจริงกลายเป็นเกณฑ์วัดความสามารถของ AI

การออกแบบหลักของ EVMbench มุ่งเน้นไปที่การทดสอบ 120 ช่องโหว่ที่สกัดจากรายงานการตรวจสอบเชิงมืออาชีพจำนวน 40 รายการ ซึ่งข้อมูลมาจากการแข่งขันการตรวจสอบสาธารณะ เช่น Code4rena เพื่อให้แน่ใจว่าสภาพแวดล้อมการทดสอบใกล้เคียงกับความซับซ้อนในโลกจริง เครื่องมือนี้จะประเมิน AI ตัวแทนในสามโหมดการทำงาน:

ภาพประกอบ: การออกแบบหลักของ EVMbench ของ OpenAI คือการประเมิน AI ตัวแทนในสามโหมดการทำงาน

  • โหมดแรกคือ “ตรวจจับ (Detect)” ซึ่งให้ AI ตรวจสอบโค้ดสัญญาอัจฉริยะและระบุช่องโหว่ที่รู้จัก พร้อมให้คะแนนตามระดับความรุนแรงของปัญหา
  • โหมดที่สองคือ “แก้ไข (Patch)” ซึ่งท้าทาย AI ให้ลบช่องโหว่ที่สามารถโจมตีได้และแก้ไขโค้ดโดยไม่กระทบต่อฟังก์ชันเดิม
  • โหมดสุดท้ายคือ “ใช้ประโยชน์ (Exploit)” ซึ่งเป็นโหมดที่ถกเถียงกันมาก AI ต้องดำเนินการโจมตีขโมยเงินในสภาพแวดล้อม sandbox ของบล็อกเชนแบบ end-to-end

เพื่อความแน่นอนและความสามารถในการทำซ้ำ ทีมงานได้พัฒนาสถาปัตยกรรมการทดสอบบนภาษา Rust โดยใช้เทคนิคการเล่นธุรกรรมที่เป็นเอกลักษณ์เพื่อยืนยันว่าการโจมตีหรือการแก้ไขของ AI สำเร็จหรือไม่

แนวโน้มการโจมตีและการป้องกันชัดเจน GPT-5.3-Codex แสดงอัตราการเติบโตของการโจมตีที่น่าทึ่ง

ผลการทดสอบเบื้องต้นแสดงให้เห็นว่า AI มีความสามารถแตกต่างกันอย่างชัดเจนในแต่ละภารกิจ โดย GPT-5.3-Codex รุ่นล่าสุด ทำผลงานได้ดีในโหมดใช้ประโยชน์ (Exploit Mode) ด้วยคะแนนสูงถึง 72.2% ซึ่งสูงกว่ารุ่น GPT-5 ที่เปิดตัวเมื่อหกเดือนก่อนซึ่งได้เพียง 31.9% อย่างมาก

ภาพประกอบ: สรุปคะแนนของโมเดล AI ต่าง ๆ ของ OpenAI ในสามโหมด

สิ่งนี้แสดงให้เห็นว่า เมื่อเป้าหมายชัดเจนว่า “ขโมยเงิน” AI มีความสามารถในการวางแผนและดำเนินการอย่างมีประสิทธิภาพ อย่างไรก็ตาม ผลด้านการป้องกันกลับค่อนข้างอ่อนแอ AI มักจะหยุดการค้นหาเมื่อพบข้อผิดพลาดเพียงจุดเดียว และเมื่อแก้ไขความซับซ้อนของตรรกะ ก็ยังพบว่ามีความยากในการซ่อมแซมช่องโหว่โดยไม่ส่งผลกระทบต่อการทำงานของสัญญาอย่างสมบูรณ์ ผู้เชี่ยวชาญด้านความปลอดภัยแสดงความกังวลว่า AI อาจลดเวลาที่ใช้ในการค้นหาช่องโหว่และพัฒนาวิธีโจมตีลงอย่างมาก ซึ่งเป็นความท้าทายต่อความเร็วในการป้องกันของโปรเจกต์ DeFi

การรับสมัครบุคลากรและการสนับสนุนด้านการป้องกัน OpenAI วางแผนสร้างความปลอดภัยในระบบนิเวศ AI ตัวแทน

นอกจากการพัฒนาเครื่องมือแล้ว OpenAI ยังเน้นการวางกลยุทธ์ด้านบุคลากรและการป้องกันในระบบนิเวศ โดยล่าสุดได้ว่าจ้าง Peter Steinberger ผู้ก่อตั้งโครงการ AI ตัวแทนโอเพนซอร์ส OpenClaw เพื่อเป็นผู้นำในการพัฒนาตัวแทนส่วนบุคคลรุ่นใหม่ และเปลี่ยนโครงการนี้เป็นโมเดลกองทุนสนับสนุนโดย OpenAI

เพื่อรับมือกับความเสี่ยงด้านความปลอดภัยทางไซเบอร์ที่อาจเกิดจาก AI OpenAI สัญญาว่าจะใช้เงินสนับสนุน 10 ล้านดอลลาร์จากโครงการสนับสนุนด้านความปลอดภัยทางไซเบอร์ เพื่อสนับสนุนเครื่องมือป้องกันโอเพนซอร์สและการวิจัยโครงสร้างพื้นฐานสำคัญ เหตุการณ์นี้มีความสำคัญอย่างยิ่งหลังจากเหตุการณ์ในโปรโตคอล Moonwell ซึ่งเกิดความผิดพลาดในการคำนวณราคาด้วย AI ส่งผลให้เกิดความเสียหายประมาณ 1.78 ล้านดอลลาร์

อ่านเพิ่มเติม
ปฏิเสธข้อเสนอจาก Meta มูลค่าหลายพันล้านดอลลาร์ ผู้สร้าง OpenClaw เข้าร่วมชิงตำแหน่งใน OpenAI กระแสแรง? การคาดการณ์ของ Moonwell เกิดข้อผิดพลาด ทำให้เสียหาย 1.78 ล้านดอลลาร์ ใครจะรับผิดชอบ?

ในอนาคต เมื่อมีการเพิ่มตัวแทนชำระเงินแบบอัตโนมัติและกระเป๋าเงินอัจฉริยะที่ใช้ AI เข้าสู่ระบบนิเวศมากขึ้น การใช้เครื่องมือเช่น EVMbench เพื่อแยกแยะโมเดลที่สามารถอธิบายช่องโหว่ได้เพียงอย่างเดียว กับโมเดลที่สามารถให้แนวทางป้องกันที่เชื่อถือได้ จะกลายเป็นจุดเปลี่ยนสำคัญในอุตสาหกรรมความปลอดภัยของบล็อกเชน

ดูต้นฉบับ
news.article.disclaimer

btc.bar.articles

ผู้สร้างกำลังถอนตัวจาก Aave – นั่นหมายความว่าอย่างไรสำหรับราคาของ AAVE?

Aave (AAVE) กำลังเผชิญกับข่าวสองด้านที่แตกต่างกันในเวลาเดียวกัน ในด้านหนึ่ง โพรโทคอลเผชิญกับการโจมตีมูลค่า $24 ล้านดอลลาร์ที่เกี่ยวข้องกับการปนเปื้อนที่อยู่ ซึ่งเตือนให้ผู้ใช้ระลึกว่าความเสี่ยงด้านความปลอดภัยยังคงมีอยู่ใน DeFi แม้จะเกิดเหตุการณ์นั้น การตอบสนองของตลาดก็เป็นไปในลักษณะบางส่วน

CaptainAltcoin35 นาที ที่แล้ว

เวสเทิร์น ยูเนี่ยน เปิดตัวเหรียญ USDPT สเตเบิลคอยน์บนเครือข่ายโซลานา

เวสเทิร์น ยูเนี่ยนกำลังเปิดตัว USDPT สกุลเงินดิจิทัลเสถียรใหม่บนเครือข่ายโซลานา ซึ่งได้รับการสนับสนุนจากสถานที่ให้บริการเงินสดกว่า 360,000 แห่งในกว่า 200 ประเทศทั่วโลก เวสเทิร์น ยูเนี่ยนกำลังก้าวกล้าสู่พื้นที่ของสกุลเงินเสถียร บริษัทชำระเงินระดับโลกประกาศเปิดตัว USDPT สกุลเงินเสถียรที่อ้างอิงกับดอลลาร์สหรัฐฯ ใหม่ ซึ่งสร้างบนเครือข่ายโซลานา

LiveBTCNews2 ชั่วโมง ที่แล้ว

เหรียญสเตเบิลยูนิทเยน: ญี่ปุ่นสามารถผลักดันการเทรดอาร์บิทราจบนเชนมูลค่า 40 ล้านล้านดอลลาร์ทั่วโลกได้หรือไม่?

ญี่ปุ่นกำลังผลักดันสกุลเงินดิจิทัลสกุลเงินเยนอย่างแข็งขันเพื่อสร้างตำแหน่งในตลาดการเงินโลก โดยมีเป้าหมายเพื่อเสริมบทบาทหลักของเยนผ่านการซื้อขายแบบอาร์บิทราจบนบล็อกเชน แม้ว่าจะเผชิญกับความท้าทายด้านสภาพคล่อง กฎระเบียบ และการมีส่วนร่วมของนักลงทุนรายย่อย แต่ความสำเร็จของโครงการนี้จะนำไปสู่ฐานสินทรัพย์นอกดอลลาร์ที่สำคัญในระบบการเงินบนบล็อกเชน

PANews2 ชั่วโมง ที่แล้ว

Aave Labs เสนอแผนบำเหน็จรางวัลช่องโหว่เฉพาะสำหรับ V4

Aave Labs เสนอให้เปิดตัวแผนการรางวัลสำหรับช่องโหว่ของ Aave V4 บนแพลตฟอร์ม Sherlock โดยมีเป้าหมายเพื่อสร้างช่องทางรายงานความปลอดภัย จัดลำดับความสำคัญในการแก้ไขช่องโหว่ที่มีความเสี่ยงสูงเป็นอันดับแรก เพื่อเพิ่มประสิทธิภาพในการจัดการ Sherlock ได้ร่วมมือกับ Aave ในงานด้านความปลอดภัยมาก่อนหน้านี้แล้ว

GateNews2 ชั่วโมง ที่แล้ว

สตาร์ทอัปด้านการเก็บรักษาเอง Bron เพิ่มกระบวนการสืบทอดมรดกที่สร้างขึ้นโดยอิงจากผู้พิทักษ์และ MPC - Unchained

บรอนด์ได้เปิดตัวคุณสมบัติ "มรดกดิจิทัล" สำหรับกระเป๋าเงินที่ดูแลเอง ซึ่งอนุญาตให้ทายาทเข้าถึงหลังจากเจ้าของเสียชีวิต โดยมีความล่าช้า 6 เดือนและผู้พิทักษ์ที่เลือกไว้ล่วงหน้าสำหรับการตรวจสอบ เป้าหมายคือเพื่อป้องกันการสูญเสียเงินทุนเนื่องจากกุญแจหรือวลีหาย

UnchainedCrypto2 ชั่วโมง ที่แล้ว

มูลนิธิ Web3 ปรับกลยุทธ์: โอนความรับผิดชอบสนับสนุนการบริหารจัดการ Polkadot, โครงการ Polkadot Wiki และอื่นๆ

มูลนิธิ Web3 ประกาศปรับกลยุทธ์ กลับสู่ภารกิจหลัก มุ่งเน้นการส่งเสริม Web3 และการจัดการทรัพยากร พร้อมทั้งส่งมอบโครงการอย่าง JAM Prize ให้กับทีมอื่น เพื่อสนับสนุนการบริหารชุมชนและการพัฒนาอย่างยั่งยืนของระบบนิเวศ

GateNews3 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น