OpenZeppelin 審査 EVMbench がデータ汚染を発見

OpenZeppelin審計EVMbench發現資料污染

ブロックチェーンセキュリティ監査会社のOpenZeppelinは、OpenAIとParadigmの共同開発したスマートコントラクトセキュリティAI基準テストであるEVMbenchを独立監査し、二つの重大な問題を発見しました:訓練データの汚染と、少なくとも4つの「高危険度脆弱性」と分類されたものが実際には無効な偽造であることです。

EVMbenchのデータ汚染問題:AI訓練の期限に関わる重要な脆弱性

EVMbenchは2026年2月中旬にリリースされ、異なるAIモデルのスマートコントラクトの脆弱性識別・修復・活用能力を評価することを目的としています。テスト期間中、AIエージェントのネットアクセス権は遮断され、インターネットからの検索を防止していました。しかし、OpenZeppelinの監査は構造的な脆弱性を明らかにしました:この基準は、2024年から2025年中頃までに行われた120回の監査から抽出された脆弱性に基づいており、多くのトップAIモデルの知識訓練の終了日も同じく2025年中頃に設定されているのです。

これは、AIエージェントが事前訓練期間中にEVMbenchの脆弱性レポートに触れている可能性が高く、その記憶にすべての問題の解答が保存されていることを意味します。OpenZeppelinは次のように述べています:「AIの安全性において最も重要な能力は、モデルがこれまで見たことのないコードの新たな脆弱性を発見することです。」データセットの規模が限定的なため、汚染が全体の評価に与える影響はさらに大きくなっています。

EVMbench監査で判明した主要な問題点

  • 訓練データの汚染:AIの事前訓練にEVMbenchの脆弱性レポートが含まれている可能性があり、「ゼロ知識発見」テストの意義を失わせている
  • 無効な高危険度脆弱性の分類:少なくとも4つの高危険度とされた脆弱性は実際には利用できない
  • 評価システムの欠陥:EVMbenchはこれら偽の脆弱性をAIが発見した場合にポイントを付与していたが、その評価基準に問題がある
  • データセットの規模の制約:これにより汚染の影響が評価結果に過度に反映されている
  • 現状のランキング:AnthropicのClaude 4.6がトップ、OpenAIのOC-GPT-5.2とGoogleのGemini 3 Proが続く

偽脆弱性の危機:少なくとも4つの高危険度分類が無効であることが判明

データ汚染に加え、OpenZeppelinはより具体的な誤りも発見しました。彼らは少なくとも4つの高危険度とされた脆弱性について評価し、これらは実際には存在しないことを確認しました。さらに重要なのは、それらの脆弱性の攻撃方法の記述自体が全く効果的でないという点です。

「これらは主観的な重大性の違いではなく、記載された攻撃方法が実行できないことに起因します」とOpenZeppelinは指摘しています。もしAIエージェントがこれらの偽の脆弱性を「発見」した場合、評価システムは誤った結果を報酬していることになります。

OpenZeppelinは、今回の監査はAIのブロックチェーンセキュリティにおける潜在能力を否定するものではないと強調しています。「問題は、AIがスマートコントラクトの安全性を変えるかどうかではなく、それらのツールを構築・評価するために用いるデータと基準が、実際に保護すべきコントラクトと同じ基準を満たしているかどうかにあります。」

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

OpenClawの創始者が釈明:一度も微博を使用したことがなく、いわゆる公式アカウントは公式ではありません

Gate News の報道によると、3月8日に、OpenClaw の公式微博アカウントの開設に関する問い合わせに対し、OpenClaw の創設者ピーター・スタインバーガーは X プラットフォームで次のように回答しました。自身は微博を一度も使用したことがなく、いわゆる「公式微博」は彼の管理下にない。

GateNews17分前

工信部がOpenClawのオープンソースAIインテリジェンスの安全リスク警告を発表

工信部は警告を発し、OpenClawオープンソースAIエージェントはデフォルト設定のままでは高い安全性リスクを伴い、ネットワーク攻撃や情報漏洩を引き起こしやすいと指摘した。ユーザーに対して設定と権限を確認し、リスクを防ぐための安全対策を講じることを推奨している。

GateNews1時間前

トレーダーのWesleyは車内で追跡器を発見し、すでに通報して同行者に安全に注意するよう警告しました。

Gate Newsによると、3月7日に、トレーダーのWesleyがXプラットフォームに投稿し、3日前に未知の追跡装置の通知を携帯電話で受け取ったことを述べた。今日、その装置を車のエンジンフードの下で発見し、自分が追跡対象であると考えている。すでに警察に通報済みだ。彼は同行者に対し、携帯電話の「未知の装置」通知を無視せず、車両を注意深く点検するよう呼びかけている。

GateNews17時間前

イラン、北朝鮮も使用!安定した仮想通貨は違法取引の主要な資産となり、関与した詐欺の額は510億ドルに達している

FATFの報告によると、ステーブルコインは違法取引の主要な資産となっており、特にイランや北朝鮮などの国で広く使用されています。同組織は、ステーブルコインの発行者に対する規制を強化するよう呼びかけており、2025年にはステーブルコインが違法な仮想資産取引の大部分を占めると指摘しています。これらの課題に対応するために、FATFは発行者に対して技術能力の向上を促し、規制の効率化を図ることを提案しています。

区块客17時間前

香港上環の両替店で顧客が刃物を持った強盗に襲われ、警察が事前に配置して容疑者を逮捕

最近、香港の上環で刃物を持った強盗事件が発生し、2人の被害者が両替店で約1000万香港ドルを換金した後に襲われました。警察は容疑者を逮捕し、被害者に財産の損失はありませんでした。これは過去3ヶ月以内にこの地域で起きた3件目の巨額現金強盗事件であり、警察は事件の関連性や犯罪グループの背景について調査を進めています。

GateNews03-07 06:12

Warden Protocolは疑似的な逃亡の疑いがあり、トークン価格は上場以来90%暴落しています。

Gate Newsの報告によると、3月7日に、コミュニティユーザーのフィードバックを受けて、Warden Protocol(WARD)が疑似的に逃亡した可能性があり、そのトークン価格は上場した特定のCEXのAlphaセクション以来、90%暴落しています。報告によると、Warden Protocolは以前、意図駆動型のモジュール式ブロックチェーンネットワークとして位置付けられていましたが、その後、AI関連のストーリーに方向転換しました。このプロジェクトは、以前、チームの3人の共同創設者全員が某CEXの背景を持つと自称していました。

GateNews03-07 05:00
コメント
0/400
コメントなし