OpenZeppelin auditoria EVMbench descobre contaminação de dados

OpenZeppelin審計EVMbench發現資料污染

A empresa de auditoria de segurança de blockchain OpenZeppelin realizou uma auditoria independente ao padrão de teste de IA de segurança de contratos inteligentes EVMbench, lançado em colaboração com OpenAI e Paradigm, e identificou duas questões graves: contaminação de dados de treino e pelo menos 4 vulnerabilidades marcadas como “alto risco” que, na realidade, são falsificações inválidas.

Problema de contaminação de dados do EVMbench: uma vulnerabilidade crítica na data de corte do treino de IA

O EVMbench foi lançado em meados de fevereiro de 2026, com o objetivo de avaliar a capacidade de diferentes modelos de IA em identificar, corrigir e explorar vulnerabilidades de contratos inteligentes. Durante os testes, o acesso à internet dos agentes de IA foi bloqueado para evitar buscas online por respostas. No entanto, a auditoria da OpenZeppelin revelou uma falha estrutural: o padrão de teste baseia-se em vulnerabilidades identificadas em 120 auditorias realizadas entre 2024 e meados de 2025, período em que a maioria dos principais modelos de IA também teve seu conhecimento treinado até essa data.

Isso significa que os agentes de IA provavelmente tiveram acesso às vulnerabilidades do EVMbench durante seu pré-treinamento, armazenando as respostas na memória. A OpenZeppelin afirmou: “A habilidade mais importante de segurança de IA é descobrir vulnerabilidades em códigos que o modelo nunca viu antes.” A limitação do tamanho do conjunto de dados aumenta ainda mais o impacto da contaminação na avaliação geral.

Principais problemas identificados na auditoria do EVMbench

  • Contaminação de dados de treino: o pré-treinamento dos agentes de IA pode incluir relatórios de vulnerabilidades do EVMbench, tornando a avaliação de “descoberta zero” sem sentido.
  • Classificação inválida de vulnerabilidades de alto risco: pelo menos 4 vulnerabilidades marcadas como de alto risco são, na verdade, inexploráveis.
  • Defeitos no sistema de pontuação: o EVMbench anteriormente atribuía pontos às descobertas dessas vulnerabilidades falsas, o que compromete a validade da avaliação.
  • Tamanho limitado do conjunto de dados: amplifica o impacto da contaminação nos resultados globais.
  • Classificação atual no ranking: Claude 4.6 da Anthropic lidera, seguido por OC-GPT-5.2 da OpenAI e Gemini 3 Pro do Google.

Crise de vulnerabilidades falsas: pelo menos 4 classificações de alto risco comprovadamente inválidas

Além da contaminação de dados, a OpenZeppelin identificou erros mais específicos. Avaliaram pelo menos 4 vulnerabilidades marcadas como de alto risco pelo EVMbench, que na realidade não existem — e, mais importante, suas descrições de exploração são inviáveis.

A OpenZeppelin afirmou: “Não se trata de uma divergência subjetiva de gravidade; as vulnerabilidades descritas simplesmente não funcionam.” Se um agente de IA “descobrir” essas vulnerabilidades falsas durante o teste, isso indica que o sistema de avaliação recompensa resultados incorretos.

A empresa destacou que esta auditoria não nega o potencial da IA na segurança de blockchain: “O problema não é se a IA mudará a segurança dos contratos inteligentes — ela certamente mudará. O problema é se os dados e padrões que usamos para construir e avaliar essas ferramentas estão alinhados com os padrões que eles pretendem proteger.”

Perguntas frequentes

O que a OpenZeppelin descobriu na auditoria do EVMbench?

A OpenZeppelin identificou duas questões principais: primeiro, a contaminação de dados, pois os relatórios de vulnerabilidades do EVMbench vêm de auditorias entre 2024 e 2025, período em que os modelos de IA também tiveram seu conhecimento treinado até lá, podendo já ter “visto” as respostas; segundo, pelo menos 4 vulnerabilidades marcadas como de alto risco que, na verdade, são falsas, pois suas explorações descritas não funcionam.

Por que a contaminação de dados é tão perigosa para a avaliação de segurança de IA?

Se o modelo de IA foi treinado com relatórios de vulnerabilidades do padrão, ele pode simplesmente “lembrar” as respostas, em vez de realmente identificar vulnerabilidades. Isso compromete a validade do teste de “zero conhecimento”, não refletindo a capacidade real do IA de auditar contratos inteligentes desconhecidos.

Qual é a postura da OpenZeppelin sobre o futuro da IA na segurança de blockchain?

A OpenZeppelin afirmou que a IA terá um impacto significativo na segurança de contratos inteligentes, mas esse impacto deve ser baseado em metodologias confiáveis e avaliações precisas. Eles veem os problemas do EVMbench como um alerta importante para o setor, não uma negação do potencial da IA.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

O trader Wesley descobriu um rastreador no carro, já acionou a polícia e alertou os colegas para tomarem cuidado com a segurança

Gate News mensagem, a 7 de março, o trader Wesley publicou na plataforma X que, há três dias, recebeu uma notificação no telemóvel sobre um dispositivo de rastreamento desconhecido. Hoje, ao verificar debaixo do capô do carro, descobriu o dispositivo e acredita que é o alvo de rastreamento. Já alertou as autoridades. Ele alerta os colegas para não ignorarem o aviso de "dispositivo desconhecido" no telemóvel e para verificarem cuidadosamente os veículos.

GateNews11h atrás

Irão e Coreia do Norte estão a usar! As stablecoins tornaram-se a principal ativo virtual para transações ilegais, com um montante envolvido de 51 mil milhões de dólares.

De acordo com o relatório do FATF, as stablecoins tornaram-se os ativos preferidos para transações ilegais, sendo amplamente utilizadas em países como Irã e Coreia do Norte. A organização apela a um reforço na supervisão dos emissores de stablecoins e indica que, em 2025, as stablecoins representarão a maior parte das transações ilegais de ativos virtuais. Para enfrentar esses desafios, o FATF recomenda que os emissores reforcem as capacidades técnicas para melhorar a eficiência regulatória.

区块客11h atrás

Clientes de uma loja de troca de anéis em Hong Kong foram assaltados com uma faca, polícia prende suspeitos com antecedência

Recentement, uma tentativa de assalto com faca ocorreu em Sheung Wan, Hong Kong. Dois vítimas foram roubadas após trocarem cerca de 10 milhões de dólares de Hong Kong numa casa de câmbio. A polícia conseguiu prender os suspeitos, e as vítimas não sofreram perdas financeiras. Este é o terceiro grande roubo de dinheiro em efectivo na região nos últimos três meses, e a polícia já iniciou investigações sobre a ligação entre os casos e o background do grupo criminoso.

GateNews19h atrás

Warden Protocol suspeito de fuga, o preço do token caiu 90% desde o lançamento

Gate News notícia, 7 de março, de acordo com feedback de utilizadores da comunidade, o Warden Protocol (WARD) suspeita-se que tenha fugido, tendo o preço do seu token caído 90% desde a sua entrada na secção Alpha de uma determinada CEX. Segundo fontes, o Warden Protocol foi inicialmente posicionado como uma rede de blockchain modular orientada por objetivos, posteriormente mudando para uma narrativa relacionada com IA. O projeto afirmou anteriormente que os três cofundadores da equipa tinham antecedentes em uma determinada CEX.

GateNews20h atrás

BlackRock limita resgates de fundo de crédito privado de 26 mil milhões de dólares, podendo afetar DeFi e o mercado de criptomoedas

O fundo de crédito privado da BlackRock começou a restringir levantamentos devido ao aumento de pedidos de resgate, o que gerou preocupações no mercado sobre crédito privado e o ecossistema DeFi. Analistas alertam que possíveis perdas de ativos ou incumprimentos podem levar a um aperto na liquidez, afetando o mercado de crédito tradicional e o mercado de criptomoedas.

GateNews03-07 00:28

Hackers da Sillytuna Movem-se Sobre $10M em Fundos de Criptomoedas Roubados

Os hackers do Sillytuna lavaram mais de $10M em fundos roubados, principalmente usando Bitcoin e DAI, através de trocas e mixers para obscurecer as origens. Apesar desses movimentos, eles ainda detêm $19M em ativos roubados.

BlockChainReporter03-06 17:24
Comentar
0/400
Nenhum comentário