OpenZeppelin 审计 EVMbench 发现数据污染

OpenZeppelin審計EVMbench發現資料污染

区块链安全审计公司 OpenZeppelin 对 OpenAI 与 Paradigm 合作推出的智能合约安全 AI 基准测试 EVMbench 进行了独立审计,并发现两大严重问题:训练资料污染以及至少 4 个被标记为「高危漏洞」的分类实际上属于无效伪造。

EVMbench 的资料污染问题:AI 训练截止日期的关键漏洞

EVMbench 于 2026 年 2 月中旬发布,旨在评估不同 AI 模型识别、修复和利用智能合约漏洞的能力,测试期间 AI 代理的网络访问权限被切断,防止其从网络搜索答案。然而,OpenZeppelin 的审计揭示了一个结构性漏洞:该基准测试是基于 2024 年至 2025 年年中期间开展的 120 次审计中筛选的漏洞,而多数顶尖 AI 模型的知识训练截止日期同样设定在 2025 年年中。

这意味着,AI 代理很可能在预训练期间已接触过 EVMbench 的漏洞报告,其记忆中可能已存储了所有问题的答案。OpenZeppelin 表示:「AI 安全最重要的能力是发现模型以前从未见过的程序码中的新漏洞。」资料集规模有限进一步放大了污染对整体评估的影响。

EVMbench 审计发现的关键问题

训练资料污染:AI 代理的预训练可能已包含 EVMbench 的漏洞报告,使「零知识发现」测试失去意义

无效高危漏洞分类:至少 4 个被标记为高危的漏洞实际上无法被利用

评分系统缺陷:EVMbench 此前对 AI 发现这些伪漏洞的行为给予积分,评分基础存在问题

资料集规模有限:进一步放大了污染对整体评估结果的影响

当前排行榜:Anthropic 的 Claude 4.6 领先,OpenAI 的 OC-GPT-5.2 和 Google 的 Gemini 3 Pro 紧随其后

伪漏洞危机:至少 4 个高危分类被证实无效

除资料污染外,OpenZeppelin 还发现了更具体的事实错误。他们评估了至少 4 个被 EVMbench 归类为高危的漏洞,发现这些漏洞实际上不存在——更关键的是,其描述的漏洞利用方式根本无法奏效。

「这些并非主观上的严重性分歧;而是发现所描述的漏洞利用方式并未奏效,」OpenZeppelin 指出。若 AI 代理在测试中「发现」了这些伪漏洞,意味着评分系统在奖励错误的结果。

OpenZeppelin 强调,这次审计并非否定 AI 在区块链安全中的潜力:「问题不在于 AI 是否会改变智能合约的安全性——它肯定会。问题在于,我们用来建构和评估这些工具的资料和基准,是否与它们旨在保护的合约遵循相同的标准。」

常见问题

OpenZeppelin 对 EVMbench 的审计发现了什么问题?

OpenZeppelin 发现两大核心问题:一是训练资料污染,EVMbench 的测试漏洞来自 2024 至 2025 年中的审计报告,与 AI 模型训练截止日期重叠,这些模型可能在预训练中已「见过」答案;二是至少 4 个高危漏洞分类属于无效伪造,其描述的攻击方式实际上无法执行。

资料污染为何对 AI 安全评测如此危险?

如果 AI 模型在预训练中已接触过基准测试的漏洞报告,它可能通过记忆体「回答」问题,而非真正的漏洞发现能力。这使整个评测失去「零知识测试」的意义,无法真实反映 AI 面对全新未知智能合约时的实际安全审计能力。

OpenZeppelin 对 AI 在区块链安全领域的前景持何种态度?

OpenZeppelin 明确表示,AI 将对智能合约安全产生重大影响,但强调这种影响必须建立在可信的方法论和准确评测基础之上。他们认为 EVMbench 的问题不是否定 AI 的信号,而是对行业标准的一次重要警示。

查看原文
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

假警察用刀威胁法国夫妇抢劫$1M 比特币

三名假扮警察的嫌疑人在凡尔赛袭击了一对夫妇,强迫他们转账约€900,000的比特币。法国当局确认了这起盗窃事件,并正在调查针对加密货币持有者的暴力抢劫日益增加的趋势。

Decrypt 5小时前

韩检被盗 320 枚比特币「失而复得」,火速套现 2,150 万美元缴国库

韩国光州地检署日前将查扣的320.8枚比特币出售,套现316亿韩元。这批比特币最初来自2018-2021年对非法赌博平台的查缉。虽然曾因公务员失误导致比特币被黑客盗取,但后来黑客将比特币归还。当局已进行调查,也发现其他查扣比特币遗失事件。

区块客6小时前

法国夫妇遭假冒警察持刀入室抢劫,被迫转移约100万美元比特币

在3月10日,法国一对夫妇在家中遭三名假冒警察持刀闯入,被迫转移约90万欧元的比特币。两人受伤并被捆绑,歹徒逃离。此案为加密货币“扳手攻击”的最新实例。法国今年多起类似事件。

GateNews6小时前

国家互联网应急中心发布 OpenClaw 安全应用风险提示,提出四项防护措施

国家互联网应急中心发布风险提示,因OpenClaw智能体的不当使用已出现安全隐患。建议用户强化网络控制、加强凭证管理、严格管理插件来源,并关注安全更新,确保安全应用。

GateNews7小时前

Cosmos 披露安全漏洞影响部分 EVM Stack 区块链,Saga 链已发布补丁

Gate News 消息,3 月 10 日,Cosmos Labs 在 X 平台披露,近期发现一项影响部分基于 Cosmos EVM Stack 构建区块链的安全漏洞。该漏洞涉及相关功能模块,已在生产环境中影响到 Layer 1 区块链

GateNews7小时前

OpenClaw智能体更新后仍存安全风险,中国信通院发布提示

Gate News 消息,3月10日,中国信息通信研究院专家针对近期火爆的开源AI智能体OpenClaw(俗称"龙虾")再次发布安全提示。专家指出,尽管该智能体已更新到最新版本并能修复已知安全漏洞,但并不意味着完全消除安全风险。此前,工业和信息化部网络安全威胁和漏洞信息共享平台已发布过相关安全风险提示。(央视新闻)

GateNews7小时前
评论
0/400
暂无评论