OpenZeppelin prüft EVMbench auf Datenverschmutzung

MarketWhisper

2026-03-03 06:12:00

Blockchain-Sicherheitsaudit-Unternehmen OpenZeppelin hat den von OpenAI und Paradigm gemeinsam entwickelten Smart Contract Security AI-Standardtest EVMbench unabhängig geprüft und zwei schwerwiegende Probleme festgestellt: Datenverschmutzung im Trainingsdatensatz und mindestens vier als „hochriskante Schwachstellen“ markierte Kategorien, die in Wirklichkeit ungültige Fälschungen sind.

Datenverschmutzungsproblem bei EVMbench: Kritische Schwachstelle im AI-Trainingstermin

EVMbench wurde Mitte Februar 2026 veröffentlicht und soll die Fähigkeit verschiedener KI-Modelle bewerten, Smart Contract-Schwachstellen zu erkennen, zu beheben und auszunutzen. Während des Tests wurde der Netzwerkzugang der AI-Agenten deaktiviert, um deren Internetrecherche zu verhindern. Die Prüfung durch OpenZeppelin enthüllte jedoch eine strukturelle Schwachstelle: Der Standard basiert auf Schwachstellen, die in 120 Audits zwischen 2024 und Mitte 2025 identifiziert wurden, wobei die meisten führenden KI-Modelle ebenfalls ihr Wissen bis Mitte 2025 aktualisiert haben.

Das bedeutet, dass die AI-Agenten wahrscheinlich während des Pre-Trainings bereits mit den Schwachstellenberichten von EVMbench konfrontiert waren und die Antworten auf alle Fragen in ihrem Speicher gespeichert haben könnten. OpenZeppelin erklärt: „Die wichtigste Fähigkeit in der AI-Sicherheit ist die Fähigkeit, neue Schwachstellen im Code zu entdecken, die das Modell zuvor noch nie gesehen hat.“ Die begrenzte Größe des Datensatzes verstärkt den Einfluss der Verschmutzung auf die Gesamtbewertung zusätzlich.

Wesentliche Probleme bei der EVMbench-Auditierung

Datenverschmutzung: Das Pre-Training der AI könnte bereits die Schwachstellenberichte von EVMbench enthalten haben, wodurch der „Zero-Knowledge“-Test an Bedeutung verliert.
Ungültige Hochrisiko-Klassifizierungen: Mindestens vier als hochriskant markierte Schwachstellen sind tatsächlich nicht ausnutzbar.
Bewertungssystem-Fehler: EVMbench hat früher Punkte für das Entdecken dieser sogenannten Falschschwachstellen vergeben, was die Bewertungsgrundlage in Frage stellt.
Begrenzter Datensatz: Verstärkt den Einfluss der Verschmutzung auf die Gesamtergebnisse.
Aktuelle Rangliste: Anthropic’s Claude 4.6 führt, gefolgt von OpenAI’s OC-GPT-5.2 und Google’s Gemini 3 Pro.

Falschschwachstellen-Krise: Mindestens vier hochriskante Klassifizierungen sind ungültig

Neben der Datenverschmutzung entdeckte OpenZeppelin konkrete Faktenfehler. Sie bewerteten mindestens vier Schwachstellen, die von EVMbench als hochriskant eingestuft wurden, und stellten fest, dass diese in Wirklichkeit nicht existieren — noch wichtiger ist, dass die beschriebenen Exploit-Methoden überhaupt nicht funktionieren.

„Das sind keine subjektiven Meinungsverschiedenheiten über die Schwere; vielmehr zeigt sich, dass die beschriebenen Exploit-Methoden nicht funktionieren“, erklärt OpenZeppelin. Wenn die AI während des Tests diese Falschschwachstellen „entdeckt“, bedeutet das, dass das Bewertungssystem falsche Ergebnisse belohnt.

OpenZeppelin betont, dass diese Prüfung nicht die Potenziale der KI im Blockchain-Sicherheitsbereich negiert: „Das Problem liegt nicht darin, ob KI die Sicherheit von Smart Contracts verändern wird — das wird sie definitiv. Das Problem ist, ob die Daten und Standards, die wir zur Entwicklung und Bewertung dieser Tools verwenden, mit den Standards übereinstimmen, die die Verträge, die sie schützen sollen, einhalten.“

Häufig gestellte Fragen

Was hat OpenZeppelin bei der EVMbench-Prüfung festgestellt?

OpenZeppelin identifizierte zwei Kernprobleme: Erstens die Datenverschmutzung, da die Schwachstellenberichte von 2024 bis 2025 stammen und mit dem Trainingsende der KI-Modelle kollidieren, sodass diese möglicherweise die Antworten bereits „gelernt“ haben; zweitens, dass mindestens vier hochriskante Schwachstellen ungültige Fälschungen sind, deren Exploit-Methoden in der Praxis nicht funktionieren.

Warum ist Datenverschmutzung so gefährlich für die KI-Sicherheitsbewertung?

Wenn die KI während des Pre-Trainings bereits mit den Schwachstellenberichten konfrontiert wurde, kann sie die Antworten aus dem Speicher abrufen, anstatt echte Schwachstellen zu erkennen. Das macht den „Zero-Knowledge“-Test sinnlos und spiegelt nicht die tatsächliche Fähigkeit der KI wider, neue, unbekannte Smart Contracts sicher zu auditieren.

Wie steht OpenZeppelin zur Zukunft der KI im Blockchain-Sicherheitsbereich?

OpenZeppelin ist klar der Meinung, dass KI einen bedeutenden Einfluss auf die Sicherheit von Smart Contracts haben wird, aber dieser Einfluss muss auf vertrauenswürdigen Methoden und genauen Bewertungsstandards basieren. Sie sehen die Probleme bei EVMbench nicht als Ablehnung der KI, sondern als wichtige Warnung für die Branche.

Original anzeigen

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

IoTeX veröffentlicht ioTube Sicherheitsvorfallbericht: Tatsächlicher Schaden von etwa 4,4 Millionen US-Dollar, vollständige Entschädigung der betroffenen Nutzer zugesagt

Project Progress Security Incidents

IoTeX veröffentlicht einen Bericht, wonach der ioTube Cross-Chain-Brückenvorfall am 6. März zu einem Verlust von etwa 4,4 Millionen US-Dollar führte. 99,5 % der gestohlenen Vermögenswerte wurden bereits eingefroren, das Team hat eine vollständige Entschädigung der betroffenen Nutzer zugesagt. Das Mainnet ist wieder in Betrieb, die Adresse des Angreifers wurde auf die Blacklist gesetzt, und gleichzeitig wird an dezentraler Governance und Sicherheitsüberprüfungen gearbeitet.

GateNews26M her

Prinzessin-Gruppe waschen in Taiwan 10,7 Milliarden! Entwicklung des eigenen „OJBK Wallet“ verbindet sich mit illegalen Devisenhandel

Enforcement Actions Security Incidents

Die Staatsanwaltschaft Taipei ermittelt im Zusammenhang mit dem Geldwäschefall der kambodschanischen „Prinz-Group“ und hat 62 Personen sowie 13 Unternehmen angeklagt. Der Betrag, der mit Geldwäsche in Verbindung steht, beläuft sich auf 10,7 Milliarden, und Vermögenswerte im Wert von 5,5 Milliarden wurden beschlagnahmt. Die Gruppe nutzte USDT und die eigens entwickelte „OJBK Wallet“ für grenzüberschreitende Geldwäsche, verschleierte die kriminellen Erlöse und hob in mehreren Ländern Bargeld ab.

区块客2Std her

HypurrFi gibt bekannt, dass in frühen Versionen von Aave V3 eine Rundungsfehler-Sicherheitslücke vorhanden war. Die neuen Kreditvergaben auf den Märkten XAUT0 und UBTC wurden ausgesetzt.

Security Incidents Exchange Risk

HyperEVM dezentralisierte Kreditprotokoll HypurrFi offenbart, dass frühere Versionen von Aave V3 eine „Rundungsfehler“-Schwachstelle aufweisen, bei der Angreifer die zugrunde liegenden Token extrahieren können. HypurrFi garantiert die Sicherheit der Nutzerfonds, hat die Versorgung und Kreditaufnahme in den betroffenen Märkten ausgesetzt und arbeitet mit den entsprechenden Parteien zusammen, um Sicherheitsprobleme zu beheben.

GateNews3Std her

AI-Agenten durchbrechen Cloudflare-Schutz, verschlüsselte DeFi-Frontend-Sicherheit wird erneut auf die Probe gestellt

Security Incidents

Kürzlich hat der autonome KI-Agent OpenClaw erfolgreich die Cloudflare-Abwehr mit der Scrapling-Bibliothek umgehen können, was Bedenken hinsichtlich der Sicherheit im DeFi-Bereich aufwirft. Obwohl dieses Tool legal Inhalte scrapen kann, erinnert es Entwickler daran, mehrschichtige Verteidigungen aufzubauen und eine übermäßige Abhängigkeit von herkömmlichen Schutzmaßnahmen zu vermeiden.

GateNews4Std her

MONTRA Token-Team „ist abgehauen“, Marktkapitalisierung schwand instant um 80 %, Schuld wird auf die iranische Wehrpflicht geschoben

Daily Crypto News Price Volatility Security Incidents Exchange Risk

Das Kryptowährungsprojekt Montra Finance wurde pausiert, da das Entwicklerteam aufgrund der Einberufung durch den Iran mobilisiert wurde, was zu einem Absturz des Token-Marktkapitals um 80 % führte. Das Fehlen offizieller Informationen hat bei Investoren Zweifel ausgelöst, einige halten es für einen „Exit-Scam“. Das Ereignis verdeutlicht den Einfluss geopolitischer Faktoren auf den Kryptomarkt, Investoren sollten bei intransparenten Projekten vorsichtig sein.

GateNews4Std her

Netzbenutzer wollen auf den „iranischen Rial“ wetten: Er ist um 90 % gefallen, also wird er definitiv steigen! Kann man so einen Kriegslottoschein kaufen?

Market Analysis Price Prediction Macroeconomics Geopolitics Regulation & Policy Security Incidents

Der iranische Rial ist innerhalb von zwei Monaten um über 96 % eingebrochen und hat damit den niedrigsten Stand der Geschichte erreicht. Wenn ein Nuklearabkommen mit den USA erzielt wird, könnte der Rial eine Erholung erfahren, aber die Kaufmöglichkeiten sind schwierig und die Risiken hoch. Investoren sollten die Risiken amerikanischer Sanktionen und die möglichen Auswirkungen der iranischen Währungsreform auf den Wechselkurs beachten. Viele tauschen Rial über Kryptowährungen um, aber Vorsicht ist geboten.

動區BlockTempo4Std her

Kommentieren

0/400

Keine Kommentare