OpenAI и Paradigm запускают EVMbench для тестирования взлома смарт-контрактов с помощью ИИ

Rongchai Wang 00:55, 05 марта 2026

Новый бенчмарк оценивает способность ИИ-агентов обнаруживать, исправлять и использовать уязвимости смарт-контрактов. GPT-5.3-Codex показывает 72,2% в задачах по эксплуатации.

OpenAI и Paradigm запускают EVMbench для тестирования взлома смарт-контрактов с помощью ИИ

OpenAI и криптовенчурная фирма Paradigm выпустили EVMbench — бенчмарк, который измеряет, насколько хорошо ИИ-агенты могут находить, исправлять и эксплуатировать уязвимости в смарт-контрактах Ethereum. Анонс произошел в момент, когда инструменты безопасности на базе ИИ стремятся защитить более 100 миллиардов $, заблокированные в DeFi протоколах.

Бенчмарк основан на 120 отобранных уязвимостях высокой степени серьезности из 40 реальных аудитов безопасности, в основном из конкурсов Code4rena. Он также включает сценарии уязвимостей из проверок безопасности Tempo — блокчейна Layer 1, созданного для платежей стейблкоинами.

Три способа взлома смарт-контрактов

EVMbench тестирует ИИ-агентов в трех различных режимах. В режиме обнаружения агенты проводят аудит репозиториев контрактов и получают оценку за нахождение известных уязвимостей. Режим исправления требует от агентов исправить уязвимый код без нарушения существующей функциональности. Режим эксплуатации является наиболее агрессивным — агенты должны выполнять реальные атаки по выводу средств против контрактов, развернутых в изолированном блокчейне.

Результаты показывают, насколько быстро развиваются возможности ИИ в этой области. GPT-5.3-Codex, работающий через Codex CLI, достиг 72,2% успеха в задачах эксплуатации. Это более чем вдвое превышает показатель 31,9% у GPT-5, который был запущен всего шестью месяцами ранее.

Интересно, что ИИ-агенты лучше справляются с атаками, чем с защитой. Настройка эксплуатации имеет четкую цель — продолжать итерации, пока не выведете средства. Обнаружение и исправление оказались сложнее. Агенты иногда останавливались после нахождения одной ошибки вместо исчерпывающего аудита, а поддержание полной функциональности контракта при устранении скрытых уязвимостей оставалось сложной задачей.

Реальные ограничения, которые стоит отметить

OpenAI признала, что EVMbench не отражает всю сложность реальной безопасности контрактов. Широко используемые протоколы, такие как Uniswap или Aave, подвергаются гораздо большему контролю, чем код конкурсов аудита. Бенчмарк также не может проверить, находит ли агент законные уязвимости, которые пропустили человеческие аудиторы — он только проверяет известные проблемы.

Среда эксплуатации работает на чистом локальном экземпляре Anvil, а не на форкнутом состоянии основной сети, и атаки, зависящие от времени, выходят за рамки. Пока только однобочечные среды.

10 миллионов $ на оборонные исследования

Вместе с EVMbench OpenAI выделила 10 миллионов $ в виде API кредитов специально для оборонных исследований безопасности. Компания расширяет доступ к своему исследовательскому агенту безопасности Aardvark для большего числа пользователей и сотрудничает с сопровождающими open-source проектов для бесплатного сканирования кодовых баз.

Время имеет значение. Поскольку ИИ-агенты становятся лучше в эксплуатации контрактов, окно между обнаружением уязвимости и эксплуатацией сужается. Команды протоколов, которые не используют аудит с помощью ИИ, все чаще будут оказываться в невыгодном положении по сравнению с атакующими, которые его используют.

OpenAI публично выпустила задачи EVMbench, инструменты и структуру оценки. Для DeFi разработчиков и исследователей безопасности это и мерило, и предупреждение о том, куда движутся возможности ИИ.

Источник изображения: Shutterstock

openai
paradigm
смарт-контракты
безопасность ИИ
defi

OpenAI и Paradigm запускают EVMbench для тестирования взлома смарт-контрактов с помощью ИИ

OpenAI и Paradigm запускают EVMbench для тестирования взлома смарт-контрактов с помощью ИИ

Три способа взлома смарт-контрактов

Реальные ограничения, которые стоит отметить

10 миллионов $ на оборонные исследования

Вам также может быть интересно

Кража биткоинов Queenbee Coin: Шокирующие подробности расследования полиции Сеула

Цена Ethereum достигла отметки в $2 200, трейдеры готовятся к следующему движению

Том Ли удваивает ставки, поскольку BitMine увеличивает запасы Ethereum до 4,47 млн ETH

Популярные новости

Кража биткоинов Queenbee Coin: Шокирующие подробности расследования полиции Сеула

Цена Ethereum достигла отметки в $2 200, трейдеры готовятся к следующему движению

Том Ли удваивает ставки, поскольку BitMine увеличивает запасы Ethereum до 4,47 млн ETH

«Что-то не так»: растет обеспокоенность из-за бессвязной речи и невнятного произношения Трампа

«Ни один университет не готовит к этому»: Ник Давыдов об образовании, энергетике и навыках, полезных в эпоху AI

Быстрое чтение

Что такое криптовалюта CLAWSTR? Введение в криптовалюту CLAWSTR

Что такое Autism Coin (AUTISM)? Введение в криптовалюту

Что такое HODL Coin HODL? Введение в криптовалюту

Что такое токен Milady MILADY? Введение в криптовалюту

Что такое Archer Aviation Tokenized Stock (ACHRON)? Введение в криптовалюту

Цены на криптовалюту