OpenZeppelin 審計 EVMbench 發現資料污染

OpenZeppelin審計EVMbench發現資料污染

區塊鏈安全審計公司 OpenZeppelin 對 OpenAI 與 Paradigm 合作推出的智能合約安全 AI 基準測試 EVMbench 進行了獨立審計,並發現兩大嚴重問題:訓練資料污染以及至少 4 個被標記為「高危漏洞」的分類實際上屬於無效偽造。

EVMbench 的資料污染問題:AI 訓練截止日期的關鍵漏洞

EVMbench 於 2026 年 2 月中旬發布,旨在評估不同 AI 模型識別、修復和利用智能合約漏洞的能力,測試期間 AI 代理的網路存取權限被切斷,防止其從網路搜尋答案。然而,OpenZeppelin 的審計揭示了一個結構性漏洞:該基準測試是基於 2024 年至 2025 年年中期間開展的 120 次審計中篩選的漏洞,而多數頂尖 AI 模型的知識訓練截止日期同樣設定在 2025 年年中。

這意味著,AI 代理很可能在預訓練期間已接觸過 EVMbench 的漏洞報告,其記憶體中可能已儲存了所有問題的答案。OpenZeppelin 表示:「AI 安全最重要的能力是發現模型以前從未見過的程式碼中的新漏洞。」資料集規模有限進一步放大了污染對整體評估的影響。

EVMbench 審計發現的關鍵問題

訓練資料污染:AI 代理的預訓練可能已包含 EVMbench 的漏洞報告,使「零知識發現」測試失去意義

無效高危漏洞分類:至少 4 個被標記為高危的漏洞實際上無法被利用

評分系統缺陷:EVMbench 此前對 AI 發現這些偽漏洞的行為給予積分,評分基礎存在問題

資料集規模有限:進一步放大了污染對整體評估結果的影響

當前排行榜:Anthropic 的 Claude 4.6 領先,OpenAI 的 OC-GPT-5.2 和 Google 的 Gemini 3 Pro 緊隨其後

偽漏洞危機:至少 4 個高危分類被證實無效

除資料污染外,OpenZeppelin 還發現了更具體的事實錯誤。他們評估了至少 4 個被 EVMbench 歸類為高危的漏洞,發現這些漏洞實際上不存在——更關鍵的是,其描述的漏洞利用方式根本無法奏效。

「這些並非主觀上的嚴重性分歧;而是發現所描述的漏洞利用方式並未奏效,」OpenZeppelin 指出。若 AI 代理在測試中「發現」了這些偽漏洞,意味著評分系統在獎勵錯誤的結果。

OpenZeppelin 強調,這次審計並非否定 AI 在區塊鏈安全中的潛力:「問題不在於 AI 是否會改變智能合約的安全性——它肯定會。問題在於,我們用來建構和評估這些工具的資料和基準,是否與它們旨在保護的合約遵循相同的標準。」

常見問題

OpenZeppelin 對 EVMbench 的審計發現了什麼問題?

OpenZeppelin 發現兩大核心問題:一是訓練資料污染,EVMbench 的測試漏洞來自 2024 至 2025 年中的審計報告,與 AI 模型訓練截止日期重疊,這些模型可能在預訓練中已「見過」答案;二是至少 4 個高危漏洞分類屬於無效偽造,其描述的攻擊方式實際上無法執行。

資料污染為何對 AI 安全評測如此危險?

如果 AI 模型在預訓練中已接觸過基準測試的漏洞報告,它可能透過記憶體「回答」問題,而非真正的漏洞發現能力。這使整個評測失去「零知識測試」的意義,無法真實反映 AI 面對全新未知智能合約時的實際安全審計能力。

OpenZeppelin 對 AI 在區塊鏈安全領域的前景持何種態度?

OpenZeppelin 明確表示,AI 將對智能合約安全產生重大影響,但強調這種影響必須建立在可信的方法論和準確評測基礎之上。他們認為 EVMbench 的問題不是否定 AI 的信號,而是對行業標準的一次重要警示。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Ethereum Fee Reduction Followed by Surge in Scams? Address Poisoning Attacks Spike, USDT Micro Transactions Soar 612%

隨著以太坊交易成本下降,地址投毒攻擊頻發。攻擊者偽造相似地址進行小額轉賬,誘導用戶誤轉資金。Fusaka升級後,小額交易劇增,造成鉅額損失。雖然攻擊成功率低,但因成本低仍有人持續施行。用戶需仔細核對地址,警惕風險。

GateNews31分鐘前

OpenClaw在中國AI交易圈爆火:散戶用AI炒加密貨幣,有人48小時賺近3000美元

OpenClaw近期在中国迅速走紅,吸引大量開發者與投資者嘗試AI自動化交易。其影響已擴散至各類人群,但也面臨安全隱患與可靠性問題。儘管降低了交易技術門檻,投資決策仍需人類把控,市場情緒在波動中逐漸變化。

GateNews37分鐘前

慢霧:ClawHub 存在後門植入風險,21% 百大 Skills 被列高危

慢霧科技警示ClawHub存在安全風險,因其依賴GitHub一鍵登入,易遭憶取開發者憑證進行供應鏈攻擊。GoPlus對百大Skills進行掃描,發現21%存在高危風險。此外,騰訊的SkillHub引發版權爭議,創始人批評其未對開源項目給予支持。建議用戶謹慎選擇Skills,並採取安全措施以防範潛在攻擊。

Market Whisper55分鐘前

690萬美元加密貨幣被盜案宣判:新加坡男子因參與駭客行動獲刑兩年

A Singapore court has sentenced a man to two years imprisonment for his involvement in a cryptocurrency theft case that resulted in approximately $6.9 million in losses. The case originated from hackers illegally accessing crypto wallets and transferring assets. Police successfully identified and arrested gang members by tracing the flow of funds. Law enforcement stated that cybercrime remains active in the digital asset sector, and countries are strengthening cooperation to enhance security measures.

GateNews1小時前

小心!迷因幣平台Bonk.fun官網遭駭客劫持,用戶加密貨幣恐被盜光

Solana 生態平台 Bonk.fun 遭駭客侵入,並植入惡意程式,部分用戶資金被盜。團隊稱損失有限,提醒用戶在漏洞修補前不要互動。2025 年全球加密貨幣詐騙損失已達 170 億美元,詐騙手法日益進化。

CryptoCity1小時前

Etherscan Warning: Address Poisoning Attacks Surge 612% After Ethereum Fusaka Upgrade

Etherscan警告称,Fusaka升级後以太坊地址投毒攻擊激增612%,共嘗試1700萬次,影響130萬用戶,損失達7930萬美元。建議用戶手動驗證地址、使用ENS域名等安全措施。

GateNews2小時前
留言
0/400
暫無留言