OpenAI e Paradigm lançam o EVMbench para a segurança do Ethereum

ETH-2,89%
  • OpenAI e Paradigm criaram o EVMbench a partir de 120 vulnerabilidades reais de auditoria.

  • Os testes de benchmark avaliam a IA nos modos de deteção, correção e exploração usando ambientes sandboxed de EVM.

  • O GPT-5.3-Codex obteve uma pontuação de 72,2% no modo de exploração, superando os resultados anteriores do GPT-5.

A OpenAI, em colaboração com a Paradigm, revelou um novo benchmark para testar o desempenho da IA na segurança de contratos inteligentes na Ethereum. O lançamento, anunciado esta semana, apresentou o EVMbench como uma forma de medir como os agentes de IA detectam, corrigem e exploram falhas nos contratos. O esforço visa riscos crescentes, uma vez que contratos inteligentes asseguram mais de 100 mil milhões de dólares em ativos cripto em redes EVM.

Benchmark Construído a Partir de Falhas Reais de Auditoria

Segundo a OpenAI, o EVMbench baseia-se em 120 vulnerabilidades de alta gravidade identificadas em 40 auditorias profissionais de contratos inteligentes. Notavelmente, muitas dessas questões tiveram origem em competições abertas de auditoria, incluindo a Code4rena. O benchmark foca em bugs reais, em vez de exemplos sintéticos.

Além disso, a OpenAI afirmou que o conjunto de dados inclui cenários ligados ao trabalho de segurança na cadeia Tempo. A Tempo funciona como uma rede Layer-1 focada em pagamentos, construída para transferências de stablecoins. Por isso, esses casos introduzem riscos de lógica de pagamento no ambiente do benchmark.

Para suportar testes realistas, os engenheiros reutilizaram scripts de provas de conceito de exploração sempre que disponíveis. No entanto, construíram manualmente componentes ausentes quando a documentação era incompleta. A OpenAI afirmou que preservou a explorabilidade, garantindo que as correções pudessem ser compiladas corretamente.

Três Modos de Teste Avaliam Agentes de IA

O EVMbench avalia os agentes nos modos de deteção, correção e exploração. No modo de deteção, os agentes escaneiam repositórios e recebem pontuações com base na recuperação de vulnerabilidades confirmadas. No modo de correção, os agentes devem corrigir falhas preservando o comportamento original do contrato.

Já o modo de exploração simula ataques completos de drenagem de fundos dentro de uma blockchain sandbox. A OpenAI afirmou que os avaliadores confirmam os resultados através de replay de transações e verificações do estado na cadeia. Para garantir consistência, a empresa criou uma ferramenta em Rust para implantações determinísticas.

Os testes de exploração são realizados num ambiente local Anvil, não em redes ao vivo. A OpenAI destacou que todas as vulnerabilidades são históricas e de conhecimento público. Além disso, a ferramenta restringe chamadas RPC inseguras para reduzir abusos.

Resultados e Expansão da Equipa

Nos resultados reportados, o GPT-5.3-Codex obteve uma pontuação de 72,2% no modo de exploração. Em comparação, o GPT-5 atingiu 31,9%, apesar de ter sido lançado meses antes. No entanto, a OpenAI afirmou que a cobertura de deteção e correção ainda está incompleta.

Juntamente com o EVMbench, a OpenAI confirmou uma contratação importante. Peter Steinberger, fundador da OpenClaw, juntou-se à empresa para trabalhar no desenvolvimento de agentes. Sam Altman confirmou a mudança na X, destacando que Steinberger liderará projetos de agentes pessoais de próxima geração.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Analista sob a tutela de Tom Lee: ETH caiu para um mínimo de 1367 dólares, mas o retorno implícito nos próximos 12 meses é de 81%

A análise de Sean Farrell, da Fundstrat, indica que o custo médio atual do Ethereum (ETH) é de 2.241 dólares, com o preço atual de 1.934 dólares, resultando numa perda média de 22%. Comparando dados históricos, o ETH pode cair até 1.367 dólares ou 1.770 dólares. O nível de perda existente chega a 9%, mas o retorno a longo prazo pode ser de +81%, com uma relação risco/recompensa que parece positiva, sugerindo que o preço está próximo do fundo.

GateNewsBot25m atrás

A equipa da plataforma Ethereum foi oficialmente fundada, com o objetivo de fortalecer a colaboração entre L1 e L2

A Fundação Ethereum estabeleceu a equipa da plataforma Ethereum, com o objetivo de melhorar o suporte ao utilizador e a integração de aplicações em L1 e L2. A equipa irá concentrar-se no desenvolvimento do protocolo, na integração técnica e no acompanhamento estratégico, avaliando o sucesso e as insuficiências do sistema Ethereum, promovendo a valorização e a adoção generalizada de L2.

GateNewsBot2h atrás

OpenAI lança 「EVMbench」: para testar se a IA consegue 「garantir a segurança dos contratos inteligentes」

Com o aumento dos riscos de segurança na criptomoeda, a OpenAI entra oficialmente no campo da segurança blockchain. Liderada pelo CEO Sam Altman, a OpenAI anunciou o lançamento de uma nova estrutura de testes chamada «EVMbench», com o objetivo de avaliar se a inteligência artificial já possui a capacidade prática de «compreender, detectar e até corrigir» vulnerabilidades em contratos inteligentes de criptomoedas. A OpenAI afirma que o EVMbench se concentrará em questões de segurança de contratos inteligentes em cadeias compatíveis com a Ethereum e a Máquina Virtual Ethereum (EVM), tendo como objetivo final estabelecer um padrão de avaliação quantificável e comparável para sistemas de IA no domínio da segurança blockchain. O termo «contrato inteligente» refere-se a códigos automatizados implantados na blockchain, que suportam amplamente aplicações financeiras descentralizadas (DeFi), protocolos de empréstimo, derivativos e outros aplicativos financeiros na cadeia. No entanto, uma vez implantados, esses contratos...

区块客3h atrás

Ethereum irá integrar o ERC-5564 na Push pela privacidade - U.Today

A rede Ethereum está a introduzir endereços stealth através do ERC-5564 para melhorar a privacidade da carteira, permitindo aos utilizadores receber pagamentos anónimos e manter confidencial o seu histórico de transações. No entanto, desafios como os requisitos de taxas de gás e riscos potenciais de spam permanecem.

UToday4h atrás
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)