OpenAI спільно з Paradigm запускає EVMbench, що тестує здатність AI-агентів до атак і захисту в смарт-контрактах EVM, викриваючи слабкі місця та переваги.
Лідер у сфері штучного інтелекту OpenAI оголосив про співпрацю з відомою компанією з ризикових інвестицій у криптовалюти Paradigm та компанією з безпеки OtterSec для запуску базового інструменту EVMbench, який оцінює безпеку AI-агентів у контексті Ethereum Virtual Machine (EVM).
Зі зростанням інтеграції AI та криптотехнологій, смарт-контракти стали ключовою інфраструктурою для управління понад 100 мільярдами відкритих криптоактивів. Вихід цього інструменту символізує початок серйозного ставлення галузі до практичних можливостей AI у «економічно значущих» середовищах.
Команда OpenAI зазначає, що з розвитком здатностей AI-агентів у написанні та плануванні коду, ці моделі у майбутньому відіграватимуть трансформуючу роль у атаках і захисті блокчейнів, тому створення стандартної системи оцінки є надзвичайно важливим для моніторингу прогресу AI.
Ядро EVMbench побудоване навколо 120 високоризикових вразливостей, витягнутих із 40 професійних аудитів, зокрема з відомих відкритих конкурсів аудиту Code4rena, що забезпечує реалістичність сценаріїв тестування. Стандарт оцінки оцінює AI-агентів у трьох режимах роботи:
Зображення: Основна концепція EVMbench — оцінка AI-агентів у трьох режимах роботи
Щоб забезпечити точність і повторюваність тестів, команда розробила тестову архітектуру на базі Rust, яка використовує детальне відтворення транзакцій для перевірки успішності атак або виправлень AI.
Перші результати тестування показали, що AI демонструє значні відмінності у здібностях залежно від завдання. Найновіша модель GPT-5.3-Codex показала високий результат у режимі експлуатації (Exploit Mode) — 72.2 %, що значно перевищує 31.9 %, показані у моделі GPT-5, випущеній лише шість місяців тому, що свідчить про неймовірний прогрес.
Зображення: Огляд результатів різних моделей AI у трьох режимах
Це свідчить про те, що при цілі «повністю вивести кошти» AI має потужні можливості для ітеративного планування та виконання атак. Водночас, у захисних функціях AI показує слабкі результати: у режимі виявлення він часто зупиняється після знаходження однієї помилки, а при складних логіках — важко виправити вразливості без порушення роботи контракту. Експерти з безпеки висловлюють занепокоєння, що AI може значно скоротити час від виявлення вразливості до створення атаки, що ставить під високий ризик DeFi-проєктів і вимагає швидшої реакції.
Крім розробки інструментів, OpenAI активно залучає фахівців і розвиває екосистему захисту. Нещодавно компанія найняла засновника проекту відкритих AI-агентів OpenClaw Пітера Штайнбергера для керівництва розробкою наступного покоління персоналізованих агентів, перетворюючи цей проект у фонд OpenAI.
Щоб протистояти потенційним кіберризикам, OpenAI пообіцяв виділити 10 мільйонів доларів через свою програму підтримки безпеки для фінансування відкритих інструментів захисту та досліджень ключової інфраструктури. Це особливо актуально після інциденту з протоколом Moonwell, де через помилку у коді AI сталася втрата близько 1,78 мільйона доларів.
Додаткові матеріали
Відмова від багатомільярдної пропозиції Meta, приєднання творця OpenClaw до OpenAI — боротьба за таланти, чи все через Vibe Coding? Прогноз Moonwell — збитки на 1,78 мільйона, хто заплатить?
У майбутньому, з появою все більшої кількості AI-помічників для стабільних монет і автоматизованих гаманців, важливо буде використовувати EVMbench для розрізнення моделей, які лише описують вразливості, і тих, що здатні надійно забезпечити захист, що стане ключовим моментом у розвитку галузі безпеки блокчейну.
Пов'язані статті
Директор Ripple висвітлює нову віху у регулюванні криптовалют у Великобританії - U.Today
Морфо Вольтс V2 загальний обсяг депозитів перевищив 1 мільярд доларів
PayPal і TCS представляють мережу блокчейн для прискорення платежів за вантажі
Molecule у співпраці з Bio Protocol запускає Science Beach, підтримуючи співпрацю AI-агентів і людських дослідників
Nansen запустила на основі штучного інтелекту інтелектуальні ончейн-сервіси для агентів, підтримуючи три способи підключення та модель оплати за потребою
Polygon представляє інструментарій CLI, що дозволяє агентам штучного інтелекту здійснювати транзакції в мережі