A OpenAI revelou uma estrutura de avaliação destinada a medir quão eficazes são os agentes de IA na deteção, mitigação e até exploração de vulnerabilidades de segurança em contratos inteligentes de criptomoedas. O projeto, intitulado “EVMbench: Avaliação de Agentes de IA na Segurança de Contratos Inteligentes”, foi lançado em colaboração com a Paradigm e a OtterSec, duas organizações com profunda experiência em segurança e investimento em blockchain. O estudo avalia os agentes de IA com base num conjunto selecionado de 120 potenciais pontos fracos provenientes de 40 auditorias de contratos inteligentes, procurando quantificar não apenas as capacidades de deteção e correção, mas também o potencial teórico de exploração desses agentes num ambiente controlado.
Principais conclusões
EVMbench testa os agentes de IA contra 120 vulnerabilidades selecionadas de 40 auditorias de contratos inteligentes, com ênfase em vulnerabilidades provenientes de competições de auditoria de código aberto.
Entre os modelos testados, o Claude Opus 4.6 da Anthropic liderou com uma média de deteção de $37.824, seguido pelo OC-GPT-5.2 da OpenAI com $31.623 e pelo Gemini 3 Pro do Google com $25.112.
A OpenAI enquadra a avaliação como um passo para medir o desempenho da IA em “ambientes economicamente relevantes”, não apenas tarefas de brincadeira, destacando as implicações no mundo real para atacantes e defensores no cenário de segurança de criptomoedas.
Os investigadores salientam que os contratos inteligentes asseguram bilhões de dólares em ativos, reforçando o valor estratégico de ferramentas habilitadas por IA para atividades ofensivas e defensivas.
Observadores do setor associaram esses desenvolvimentos a discussões mais amplas sobre pagamentos impulsionados por IA e o papel das stablecoins nas transações diárias, com altos executivos a preverem um uso crescente de agentes inteligentes nos próximos anos.
O contexto para esse trabalho é reforçado pelos dados de incidentes de segurança em criptomoedas de 2025, que mostram um fluxo contínuo de fundos através de vulnerabilidades e ataques, reforçando a necessidade de ferramentas robustas e mecanismos de correção mais rápidos e confiáveis. A estrutura EVMbench é posicionada, em parte, como uma forma de medir se os agentes de IA podem contribuir de forma significativa para capacidades defensivas em escala, reduzindo oportunidades de exploração e acelerando a mitigação de ameaças.
Para construir a avaliação, os investigadores basearam-se em 120 vulnerabilidades selecionadas de 40 auditorias de contratos inteligentes, muitas das quais remontam a desafios de auditoria de código aberto. A OpenAI defende que a avaliação ajudará a acompanhar o progresso da IA na identificação e mitigação de fraquezas ao nível do contrato, oferecendo uma forma padronizada de comparar futuros modelos de IA à medida que evoluem. O estudo também fornece uma perspetiva de como a IA pode ser aplicada para normalizar a avaliação de risco em diversas arquiteturas de contratos inteligentes, em vez de focar apenas em casos isolados.
Contratos inteligentes não foram feitos para humanos: Dragonfly
Num tópico recente na plataforma X, Haseeb Qureshi, sócio da Dragonfly, argumentou que a promessa das criptomoedas de substituir direitos de propriedade e contratos tradicionais nunca se concretizou não porque a tecnologia falhou, mas porque nunca foi concebida com a intuição humana em mente. Ele destacou o medo persistente associado à assinatura de grandes transações num ambiente onde carteiras de drenagem e outros vetores de ataque continuam a ser uma ameaça constante, em contraste com a experiência mais fluida das transferências bancárias tradicionais.
Qureshi defende que a próxima fase das transações em criptomoedas poderá ser viabilizada por carteiras autónomas, intermediadas por IA. Essas carteiras monitorariam riscos, geririam operações complexas e responderiam autonomamente a ameaças em nome dos utilizadores, potencialmente reduzindo a fricção e o medo que caracterizam as transferências de grande valor atualmente.
“Uma tecnologia muitas vezes encaixa-se no lugar assim que o seu complemento finalmente chega. O GPS teve que esperar pelo smartphone, o TCP/IP teve que esperar pelo navegador. Para as criptomoedas, talvez tenhamos acabado de encontrar essa solução na IA.”
A principal conclusão deste tópico é que os agentes de IA podem desempenhar um papel fundamental na transformação da interação das pessoas com as criptomoedas—passando de transações manuais, propensas a erros, para processos automatizados, conscientes do risco, que podem escalar com a adoção. À medida que os agentes de IA demonstram maior competência na gestão de questões de segurança, os utilizadores poderão beneficiar de maior fiabilidade e resiliência nos fluxos de trabalho de finanças descentralizadas, mesmo com a tecnologia subjacente a evoluir.
O que acompanhar a seguir
Publicação e replicação independente do conjunto completo de dados do EVMbench em diferentes modelos e arquiteturas de IA.
Maior adoção de fluxos de auditoria assistida por IA por parte de auditores, bolsas de valores e projetos DeFi que pretendem reforçar as suas posturas de segurança.
Exploração de carteiras autónomas e fluxos de pagamento automatizados, incluindo considerações regulatórias e de conformidade para ativos geridos por IA.
Benchmarks subsequentes comparando mais sistemas de IA à medida que novas versões são lançadas, acompanhando melhorias na precisão de deteção e velocidade de correção.
Fontes e verificação
OpenAI: EVMbench: Avaliação de Agentes de IA na Segurança de Contratos Inteligentes — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
OpenAI: Apresentando o EVMbench — https://openai.com/index/introducing-evmbench/
Perdas de segurança em criptomoedas em 2025 (cobertura de relatórios): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
Dragonfly: Haseeb Qureshi sobre IA e UX de criptomoedas (post no X): https://x.com/hosseeb/status/2024136762424185208
Liderança da China em IA e implicações para criptomoedas (análise): https://cointelegraph.com/news/china-ai-lead-future
AI Eye — Desenvolvimentos em IronClaw e bots de IA na cobertura do Polymarket: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/
Figuras-chave e próximos passos
O estudo EVMbench demonstra que grandes modelos de linguagem e agentes de IA relacionados estão começando a desempenhar funções de segurança relevantes no espaço de contratos inteligentes, com diferenças claramente quantificáveis entre os modelos. A liderança do Claude Opus 4.6 na média de deteções indica que certas arquiteturas podem ser mais aptas a identificar e mitigar vulnerabilidades em lógica de contratos complexos, enquanto outras ficam atrás, oferecendo um espectro de capacidades que os investigadores provavelmente irão querer refinar. A inclusão de múltiplas parcerias industriais no projeto reforça o consenso crescente de que a segurança habilitada por IA e a gestão automatizada de riscos podem tornar-se essenciais para escalar em ambientes descentralizados.
À medida que o setor evolui, os observadores estarão atentos à rapidez com que os agentes de IA podem passar da deteção à remediação, e se esses agentes podem operar de forma fiável em sistemas ao vivo sem introduzir novos riscos. A discussão sobre carteiras de IA e pagamentos autónomos aborda questões mais amplas de governação de segurança, consentimento do utilizador e conformidade regulatória. Se a trajetória sugerida pela OpenAI e seus parceiros continuar, as ferramentas assistidas por IA poderão tornar-se um componente central da infraestrutura futura de criptomoedas, alterando tanto o cálculo de risco quanto a experiência do utilizador de forma significativa. A próxima ronda de avaliações, juntamente com implementações no mundo real, ajudará a determinar quão rapidamente essa visão se concretiza e que salvaguardas devem acompanhá-la.
Este artigo foi originalmente publicado como OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts on Crypto Breaking News — sua fonte de confiança para notícias de criptomoedas, Bitcoin e atualizações de blockchain.