🥷 #OpenAI and Paradigm launched EVMbench, a benchmark designed to measure how well #Les agents IA peuvent détecter, corriger et exploiter les vulnérabilités dans les écosystèmes EVM tels qu'Ethereum. Le benchmark est construit à partir de 120 vulnérabilités à haute gravité sélectionnées parmi 40 audits et inclut des scénarios liés à la chaîne Tempo. Les tests montrent que GPT-5.3-Codex a obtenu un score de 72,2 % en mode "exploitation" contre 31,9 % pour GPT-5, tandis que la couverture pour la détection et la correction des vulnérabilités reste incomplète. #hack
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
🥷 #OpenAI and Paradigm launched EVMbench, a benchmark designed to measure how well #Les agents IA peuvent détecter, corriger et exploiter les vulnérabilités dans les écosystèmes EVM tels qu'Ethereum. Le benchmark est construit à partir de 120 vulnérabilités à haute gravité sélectionnées parmi 40 audits et inclut des scénarios liés à la chaîne Tempo. Les tests montrent que GPT-5.3-Codex a obtenu un score de 72,2 % en mode "exploitation" contre 31,9 % pour GPT-5, tandis que la couverture pour la détection et la correction des vulnérabilités reste incomplète. #hack
#crypto