OpenAI представила эталонную платформу, направленную на измерение того, насколько эффективно ИИ-агенты могут обнаруживать, смягчать и даже использовать уязвимости безопасности в криптовалютных смарт-контрактах. Проект под названием "EVMbench: Evaluating AI Agents on Smart Contract Security" был выпущен в сотрудничестве с Paradigm и OtterSec, двумя организациями с глубокими знаниями в области безопасности блокчейна и инвестиций. Исследование оценивает ИИ-агентов на основе тщательно отобранного набора из 120 потенциальных слабостей, взятых из 40 аудитов смарт-контрактов, стремясь количественно оценить не только возможности обнаружения и исправления, но и теоретический потенциал эксплуатации этих агентов в контролируемой среде.
Награды за обнаружение для ИИ-агентов подробно описаны в PDF-файле OpenAI, сопровождающем исследование, который также описывает методологию оценки и сценарии, используемые для моделирования реальных рисков смарт-контрактов. Авторы подчеркивают, что хотя ИИ-агенты эволюционировали для автоматизации широкого спектра рутинных задач, оценка их производительности в "экономически значимых средах" необходима для понимания того, как они будут работать под давлением в производственных системах.
OpenAI отмечает, что ожидает, что агентные технологии расширят сферу платежей и расчетов, включая стейблкоины, используемые в автоматизированных рабочих процессах. Обсуждение платежей на базе ИИ выходит за рамки тестирования безопасности к более широкому вопросу о том, как автономные системы будут участвовать в повседневной финансовой деятельности. Собственные прогнозы компании предполагают, что агентные платежи могут стать более распространенными, закрепляя возможности ИИ в практических случаях использования, затрагивающих повседневные потребительские транзакции.
Одновременно с результатами тестирования генеральный директор Circle Джереми Аллэйр публично спрогнозировал, что миллиарды ИИ-агентов могут совершать транзакции со стейблкоинами для повседневных платежей в течение следующих пяти лет. Это мнение пересекается с повторяющейся темой в криптовалютных кругах: потенциалом криптовалюты стать родной валютой ИИ-агентов, нарратив, который получил заметное внимание со стороны отраслевых лидеров и инвесторов. Хотя такие прогнозы остаются спекулятивными, основная тенденция ясна — автоматизация ИИ переходит от лаборатории к транзакционному уровню, где она может изменить то, как ценность перемещается по сетям.
Исследование появилось в момент, когда безопасность криптовалют продолжает оставаться значительным фактором риска для инвесторов. Данные о нападении на криптовалютные фонды в 2025 году — где злоумышленники похитили примерно 3,4 миллиарда $ — подчеркивают срочность улучшенных инструментов и более быстрых, более надежных механизмов исправления. Платформа EVMbench позиционируется, в частности, как способ измерить, могут ли ИИ-агенты значимо способствовать оборонительным возможностям в масштабе, сокращая возможности эксплуатации и ускоряя смягчение угроз.
Для создания эталонного теста исследователи использовали 120 тщательно отобранных уязвимостей, охватывающих 40 аудитов смарт-контрактов, причем многие слабости восходят к вызовам аудита с открытым исходным кодом. OpenAI утверждает, что эталонный тест поможет отслеживать прогресс ИИ в распознавании и смягчении слабостей на уровне контрактов в масштабе, предлагая стандартизированный способ сравнения будущих моделей ИИ по мере их развития. Исследование также дает представление о том, как ИИ может применяться для нормализации оценки рисков в широком диапазоне архитектур смарт-контрактов, а не фокусироваться исключительно на изолированных случаях.
В одновременной ветке на X Хасиб Куреши, партнер Dragonfly, утверждал, что обещание криптовалюты заменить имущественные права и традиционные контракты так и не материализовалось не потому, что технология провалилась, а потому, что она никогда не была разработана с учетом человеческой интуиции. Он подчеркнул постоянный страх, связанный с подписанием крупных транзакций в среде, где кошельки-опустошители и другие векторы атак остаются постоянной угрозой, в резком контрасте с относительно более плавным опытом традиционных банковских переводов.
Куреши утверждает, что следующий этап криптовалютных транзакций может быть обеспечен кошельками с посредничеством ИИ и самоуправляемыми. Такие кошельки будут отслеживать риски, управлять сложными операциями и автономно реагировать на угрозы от имени пользователей, потенциально снижая трения и страх, которые характеризуют крупные переводы сегодня.
Более широкий вывод из этой ветки заключается в том, что ИИ-агенты могут сыграть критическую роль в трансформации взаимодействия людей с криптовалютой — переходе от ручных, подверженных ошибкам транзакций к автоматизированным, учитывающим риски процессам, которые могут масштабироваться с принятием. По мере того как ИИ-агенты начинают демонстрировать большую компетентность в решении проблем безопасности, пользователи могут увидеть улучшенную надежность и устойчивость в рабочих процессах децентрализованных финансов, даже когда базовые технологии продолжают созревать.
Исследование EVMbench демонстрирует, что большие языковые модели и связанные ИИ-агенты начинают выполнять значимую работу по безопасности в области смарт-контрактов с четко измеримыми различиями между моделями. Лидерство Claude Opus 4.6 в средних наградах за обнаружение сигнализирует о том, что определенные архитектуры могут быть более искусными в обнаружении и смягчении уязвимостей в сложной логике контрактов, в то время как другие отстают, предлагая спектр возможностей, которые исследователи, вероятно, захотят усовершенствовать. Включение нескольких отраслевых партнерств в проект подчеркивает растущий консенсус в том, что безопасность на базе ИИ и автоматизированное управление рисками могут стать необходимыми для масштабирования в децентрализованных средах.
По мере развития области наблюдатели будут следить за тем, как быстро ИИ-агенты могут перейти от обнаружения к исправлению, и могут ли эти агенты надежно работать в живых системах без внесения новых рисков. Разговор о кошельках на базе ИИ и автономных платежах затрагивает более широкий набор вопросов, касающихся управления безопасностью, согласия пользователей и нормативного согласования. Если траектория, предложенная OpenAI и ее партнерами, продолжится, инструменты с помощью ИИ могут стать основным компонентом будущей криптоинфраструктуры, меняя как расчет рисков, так и пользовательский опыт значимыми способами. Следующий раунд эталонных тестов вместе с реальными развертываниями поможет определить, насколько быстро это видение материализуется и какие меры безопасности должны его сопровождать.
Эта статья была первоначально опубликована как OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts на Crypto Breaking News – вашем надежном источнике криптовалютных новостей, новостей Bitcoin и обновлений блокчейна.


