OpenAI запускает систему оценки безопасности для крипто-токенов и смарт-контрактов

CoinsProbe
ETH1,67%
DEFI11,75%


Ключевые выводы

  • OpenAI запустила EVMbench — новую систему бенчмаркинга, разработанную совместно с Paradigm, для тестирования того, как продвинутые модели ИИ обнаруживают, исправляют и используют уязвимости в смарт-контрактах Ethereum.

  • Ранние результаты показывают «Разрыв эксплойтов»: лучшие модели сейчас лучше выполняют атаки, чем проводят всесторонний аудит или исправление ошибок — что подчеркивает быстрый прогресс ИИ и возникающие риски.

  • EVMbench может изменить стандарты безопасности в криптоиндустрии, обеспечивая постоянные аудиты с помощью ИИ для команд DeFi и предоставляя институциональные гарантии по мере перемещения миллиардов активов в блокчейн.


В важном слиянии искусственного интеллекта и блокчейн-технологий OpenAI официально запустила EVMbench. Разработанная в стратегическом партнерстве с крипто-инвестиционной компанией Paradigm, эта система бенчмаркинга предназначена для строгого тестирования того, как ИИ-агенты выявляют, используют и устраняют уязвимости в экосистеме Ethereum Virtual Machine (EVM).

С более чем 100 миллиардами долларов в открытых криптоактивах, защищенных смарт-контрактами, ставки никогда не были выше. EVMbench представляет собой проактивный сдвиг в сторону использования «передовых моделей» для защиты децентрализованных финансов (DeFi) от все более изощренных киберугроз.

Источник: openai

Три столпа EVMbench

EVMbench выходит за рамки статического анализа кода, оценивая ИИ-агентов в трех критических режимах работы. Этот цикл «Обнаружение — Исправление — Эксплуатация» имитирует реальный рабочий процесс ведущего специалиста по безопасности.

  • 1. Режим обнаружения (Аудитор): агенты сканируют сложные репозитории кода, чтобы выявить скрытые уязвимости. Успех измеряется по «Recall» — способности находить «истинные» проблемы — и по моделируемым наградам за баг-баунти.

  • 2. Режим исправления (Инженер): после обнаружения ошибки агент должен переписать код. В бенчмарке используются автоматические тестовые наборы, чтобы убедиться, что исправление устраняет уязвимость, не ломая исходную функциональность контракта.

  • 3. Режим эксплуатации (Агрессор): в безопасной изолированной среде Anvil sandbox агенты пытаются выполнить комплексные атаки для вывода средств. Это измеряет наступательное мышление агента и его способность «цепочкой» соединять мелкие уязвимости в катастрофический прорыв.

Источник: openai

Внутри набора данных: реальные риски

EVMbench основана не на теоретических задачах, а на тщательно подобранной библиотеке из 120 уязвимостей высокой степени серьезности, собранных из 40 профессиональных аудитов. Значительная часть данных поступает из реальных конкурсов по аудиту (например, Code4rena) и внутренних процессов безопасности Paradigm на блокчейне Tempo.

Фокусируясь на «платежных» контрактах, бенчмарк обеспечивает проверку ИИ-моделей на типах кода, обрабатывающих миллиарды ликвидных средств.

Результаты бенчмарка: рост GPT-5.3-Codex

Внутренние тесты OpenAI показали поразительный рост возможностей ИИ. За несколько месяцев ведущие модели эволюционировали от неспособности решать базовые логические задачи до выполнения сложных многошаговых эксплойтов.

«Разрыв эксплойтов»: интересно, что агенты сейчас значительно лучше в использовании уязвимостей (72,2%), чем в обнаружении или исправлении. Исследователи OpenAI отметили, что агенты отлично справляются с конкретной, явной задачей — например, «вывести средства», — но требуют более тонкого мышления для выполнения сложной, «длинной» задачи полного аудита.

Источник: Openai

Почему это важно: смещение безопасности «влево»

Для всей криптоэкосистемы EVMbench — это не просто оценка, а ускоритель развития «Security-Left» — интеграции высокого уровня аудита прямо в процесс кодирования, а не после его завершения.

  • Демократизация безопасности: небольшие команды DeFi, не способные оплатить ручной аудит за 200 тысяч долларов, могут использовать ИИ-агентов, сертифицированных EVMbench, для постоянных высокоточных проверок кода.

  • Готовность к институтам: такие гиганты традиционных финансов, как Goldman Sachs и Franklin Templeton, переходят в цепочку, и им нужен «золотой стандарт» AI-управления, который обеспечивает стандартизированный бенчмарк.

  • Двойное использование: открывая исходный код бенчмарка, OpenAI и Paradigm дают «хорошим парням» инструменты для измерения и опережения «плохих», одновременно поддерживая «Доверенный доступ для кибербезопасности» для мониторинга новых рисков.

Взгляд в будущее

Хотя EVMbench — революционный шаг, он пока ограничен детерминированными, изолированными средами. В будущих версиях планируется интеграция мультицепочечных зависимостей и MEV (Maximal Extractable Value) для более точного моделирования «Темного леса» в реальной сети Ethereum.

По мере того, как ИИ-агенты переходят от «написания кода» к «обеспечению безопасности экономики», EVMbench станет окончательным ориентиром для следующего поколения доверительных финансов.


Отказ от ответственности: Взгляды и анализ, представленные в этой статье, носит информационный характер и отражают точку зрения автора, а не финансовые рекомендации. Обсуждаемые технические модели и индикаторы подвержены рыночной волатильности и могут не дать ожидаемых результатов. Инвесторам рекомендуется проявлять осторожность, проводить самостоятельные исследования и принимать решения в соответствии со своей толерантностью к рискам.


Об авторе: Нилеш Хембаде — основатель и ведущий автор Coinsprobe, с более чем 5-летним опытом работы в индустрии криптовалют и блокчейна. С момента запуска Coinsprobe в 2023 году он предоставляет ежедневные аналитические обзоры, основанные на исследованиях, данных блокчейна и техническом анализе.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев