Новый бенчмарк оценивает способность ИИ-агентов обнаруживать, исправлять и эксплуатировать уязвимости смарт-контрактов. GPT-5.3-Codex набирает 72,2% в задачах на эксплуатацию. (ПодробнееНовый бенчмарк оценивает способность ИИ-агентов обнаруживать, исправлять и эксплуатировать уязвимости смарт-контрактов. GPT-5.3-Codex набирает 72,2% в задачах на эксплуатацию. (Подробнее

OpenAI и Paradigm запускают EVMbench для тестирования взлома смарт-контрактов с помощью ИИ

2026/03/05 08:55
3м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

OpenAI и Paradigm запускают EVMbench для тестирования взлома смарт-контрактов с помощью ИИ

Rongchai Wang 00:55, 05 марта 2026

Новый бенчмарк оценивает способность ИИ-агентов обнаруживать, исправлять и использовать уязвимости смарт-контрактов. GPT-5.3-Codex показывает 72,2% в задачах по эксплуатации.

OpenAI и Paradigm запускают EVMbench для тестирования взлома смарт-контрактов с помощью ИИ

OpenAI и криптовенчурная фирма Paradigm выпустили EVMbench — бенчмарк, который измеряет, насколько хорошо ИИ-агенты могут находить, исправлять и эксплуатировать уязвимости в смарт-контрактах Ethereum. Анонс произошел в момент, когда инструменты безопасности на базе ИИ стремятся защитить более 100 миллиардов $, заблокированные в DeFi протоколах.

Бенчмарк основан на 120 отобранных уязвимостях высокой степени серьезности из 40 реальных аудитов безопасности, в основном из конкурсов Code4rena. Он также включает сценарии уязвимостей из проверок безопасности Tempo — блокчейна Layer 1, созданного для платежей стейблкоинами.

Три способа взлома смарт-контрактов

EVMbench тестирует ИИ-агентов в трех различных режимах. В режиме обнаружения агенты проводят аудит репозиториев контрактов и получают оценку за нахождение известных уязвимостей. Режим исправления требует от агентов исправить уязвимый код без нарушения существующей функциональности. Режим эксплуатации является наиболее агрессивным — агенты должны выполнять реальные атаки по выводу средств против контрактов, развернутых в изолированном блокчейне.

Результаты показывают, насколько быстро развиваются возможности ИИ в этой области. GPT-5.3-Codex, работающий через Codex CLI, достиг 72,2% успеха в задачах эксплуатации. Это более чем вдвое превышает показатель 31,9% у GPT-5, который был запущен всего шестью месяцами ранее.

Интересно, что ИИ-агенты лучше справляются с атаками, чем с защитой. Настройка эксплуатации имеет четкую цель — продолжать итерации, пока не выведете средства. Обнаружение и исправление оказались сложнее. Агенты иногда останавливались после нахождения одной ошибки вместо исчерпывающего аудита, а поддержание полной функциональности контракта при устранении скрытых уязвимостей оставалось сложной задачей.

Реальные ограничения, которые стоит отметить

OpenAI признала, что EVMbench не отражает всю сложность реальной безопасности контрактов. Широко используемые протоколы, такие как Uniswap или Aave, подвергаются гораздо большему контролю, чем код конкурсов аудита. Бенчмарк также не может проверить, находит ли агент законные уязвимости, которые пропустили человеческие аудиторы — он только проверяет известные проблемы.

Среда эксплуатации работает на чистом локальном экземпляре Anvil, а не на форкнутом состоянии основной сети, и атаки, зависящие от времени, выходят за рамки. Пока только однобочечные среды.

10 миллионов $ на оборонные исследования

Вместе с EVMbench OpenAI выделила 10 миллионов $ в виде API кредитов специально для оборонных исследований безопасности. Компания расширяет доступ к своему исследовательскому агенту безопасности Aardvark для большего числа пользователей и сотрудничает с сопровождающими open-source проектов для бесплатного сканирования кодовых баз.

Время имеет значение. Поскольку ИИ-агенты становятся лучше в эксплуатации контрактов, окно между обнаружением уязвимости и эксплуатацией сужается. Команды протоколов, которые не используют аудит с помощью ИИ, все чаще будут оказываться в невыгодном положении по сравнению с атакующими, которые его используют.

OpenAI публично выпустила задачи EVMbench, инструменты и структуру оценки. Для DeFi разработчиков и исследователей безопасности это и мерило, и предупреждение о том, куда движутся возможности ИИ.

Источник изображения: Shutterstock
  • openai
  • paradigm
  • смарт-контракты
  • безопасность ИИ
  • defi
Возможности рынка
Логотип Smart Blockchain
Smart Blockchain Курс (SMART)
$0.004281
$0.004281$0.004281
-0.71%
USD
График цены Smart Blockchain (SMART) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.