【CryptoWorld】2026 est là, le domaine de la sécurité de l’IA passe également une grande étape — LISABench annonce le lancement d’une évaluation majeure pour le premier trimestre. Ce n’est pas une simulation, mais un test réel pour voir quels modèles d’IA sont les plus performants dans la détection de vulnérabilités des contrats intelligents Web3.
Regardez cette liste de participants, c’est tout simplement la “dream team” mondiale dans le domaine de l’IA : KIMI K2, DeepSeek V3.2, QWen 3, GLM 4.6, GPT-5.2, Gemini-3-pro-preview, Claude 4.5, sept modèles de pointe en compétition. Du côté national avec Moonshot, DeepSeek, Alibaba, Zhipu, et à l’international avec OpenAI, Google, Anthropic, cette évaluation est d’une richesse exceptionnelle.
Ce qui est le plus intéressant, c’est que LISABench a aussi lancé une interaction communautaire. Un canal de vote prédictif a été ouvert, permettant aux utilisateurs de parier à l’avance sur le gagnant. En même temps, la bibliothèque de code des standards d’évaluation est open source, permettant aux développeurs de vérifier eux-mêmes les résultats, cette transparence est considérée comme sérieuse dans l’industrie.
Pour ceux qui s’intéressent à la sécurité Web3 et aux avancées de l’IA, ces résultats d’évaluation peuvent éclairer certains points — quels modèles sont réellement adaptés pour faire office de “médecins généralistes” pour les contrats intelligents. Les résultats du Q1 devraient être connus très bientôt.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
13 J'aime
Récompense
13
10
Reposter
Partager
Commentaire
0/400
GasDevourer
· 01-08 04:15
DeepSeek cette fois-ci arrive vraiment en force, V3.2 peut-il surpasser GPT-5.2 ?
DeepSeek va encore faire des vagues, c'est le rythme que j'aime
En ce qui concerne l'audit de contrat, les modèles nationaux ne doivent vraiment pas être sous-estimés, c'est intéressant
Les sept seront tous là, voyons qui sera le plus résistant, ça promet d'être sanglant
Si cette fois DeepSeek gagne le test, OpenAI sera vraiment embarrassé
LISABench joue vraiment cette fois, préparez-vous à voir des scènes de crash
L'opportunité pour les modèles nationaux de se redresser est arrivée, il faut suivre ça
Voir l'originalRépondre0
BakedCatFanboy
· 01-07 20:18
DeepSeek cette fois-ci pourra-t-elle se relever ? J'ai l'impression qu'on en a trop fait l'éloge.
Voir l'originalRépondre0
NftRegretMachine
· 01-07 11:05
Encore une compétition de modèles d'IA, hein ? Cette fois, on pourra vraiment voir qui est fiable.
DeepSeek pourra-t-il se relever cette fois-ci ?
La lineup des modèles nationaux est correcte, mais on ne sait pas vraiment comment ils se comportent en pratique.
On attend que les résultats sortent, il y en a déjà beaucoup d’évaluations.
Pour la détection de contrats intelligents, il faut vraiment regarder les antécédents de sécurité concrets.
GLM pourra-t-il surpasser Claude ? Je parie cinq euros que non.
Honnêtement, beaucoup de grands modèles se vantent, peu sont réellement utilisables.
Parmi ces sept modèles, il y en a deux que je n’ai jamais entendus parler, le cercle Web3 a-t-il vraiment progressé ?
Voir l'originalRépondre0
WenMoon42
· 01-07 08:34
Euh DeepSeek, cette fois-ci, ça va le faire ? On dirait que les modèles domestiques ont récemment pris de l'ampleur.
Voir l'originalRépondre0
ChainSpy
· 01-05 04:50
DeepSeek cette fois pourra-t-elle renverser GPT, on a vraiment l'impression que les modèles domestiques ont vraiment progressé ces deux dernières années
Voir l'originalRépondre0
MetaMaximalist
· 01-05 04:50
ngl c'est exactement le genre de référence en matière de durabilité des protocoles dont nous avions besoin depuis des années... mais soyons honnêtes, la plupart de ces modèles vont probablement avoir du mal avec les vecteurs d'attaque nuancés que seuls les premiers adopteurs comprennent réellement
Voir l'originalRépondre0
UncleWhale
· 01-05 04:34
DeepSeek又来搞事情了,这次真的能行吗?
---
Contrôle des vulnérabilités des contrats ? En gros, c'est toujours une question de savoir quel modèle est le plus intelligent. DeepSeek peut-il se relever cette fois-ci haha
---
Sept grands modèles s'affrontent, je veux juste voir qui sera le premier à être découvert avec un problème...
---
Attendez, les modèles domestiques peuvent aussi rivaliser avec GPT5 ? La chronologie va un peu vite là
---
Encore une course aux armements, ceux qui en profitent le plus sont probablement les équipes qui travaillent vraiment sur la sécurité
---
La question est : DeepSeek est le plus stable, les autres ne font que de la figuration
---
La sécurité Web3 ne suffit pas avec l'IA, il faut aussi des revues humaines pour que ce soit fiable
---
Combien de temps faut-il pour que ces résultats d’évaluation sortent... Peut-on accélérer, je suis impatient
Voir l'originalRépondre0
bridge_anxiety
· 01-05 04:26
deepseek cette fois, pouvez-vous sortir quelques nouveautés ?
Voir l'originalRépondre0
MetaverseMortgage
· 01-05 04:25
DeepSeek est de retour, cette fois-ci pour voir s'il peut vraiment résoudre le problème des vulnérabilités de contrat
Cette équipe est vraiment impressionnante, mais il faut encore voir comment elle fonctionne en pratique avec les données
Enfin quelqu'un ose vraiment faire un test de résistance à ces modèles, j'attends les résultats avec impatience
Honnêtement, le modèle d'IA pour la sécurité Web3 n'est pas encore fiable, je vais attendre de voir la blague
KIMI et Claude se battre devrait être intéressant, je parie cinq euros que Claude va faire un flop
Ah là... sept modèles en même temps, on dirait un grand chaos, c'est un peu confus
La sécurité des contrats ne peut pas se reposer uniquement sur la détection par IA, il faut aussi une audit humaine pour assurer la sécurité
Les modèles nationaux peuvent enfin rivaliser dans cette catégorie, je suis un peu impatient
Vraiment ? GPT-5.2 est déjà sorti ? Je n'en ai pas entendu parler
LISABench a fait un bon boulot avec cette campagne marketing, la popularité est assurée
Confrontation de modèles d'IA : qui remportera la bataille pour la sécurité des contrats intelligents Web3 ?
【CryptoWorld】2026 est là, le domaine de la sécurité de l’IA passe également une grande étape — LISABench annonce le lancement d’une évaluation majeure pour le premier trimestre. Ce n’est pas une simulation, mais un test réel pour voir quels modèles d’IA sont les plus performants dans la détection de vulnérabilités des contrats intelligents Web3.
Regardez cette liste de participants, c’est tout simplement la “dream team” mondiale dans le domaine de l’IA : KIMI K2, DeepSeek V3.2, QWen 3, GLM 4.6, GPT-5.2, Gemini-3-pro-preview, Claude 4.5, sept modèles de pointe en compétition. Du côté national avec Moonshot, DeepSeek, Alibaba, Zhipu, et à l’international avec OpenAI, Google, Anthropic, cette évaluation est d’une richesse exceptionnelle.
Ce qui est le plus intéressant, c’est que LISABench a aussi lancé une interaction communautaire. Un canal de vote prédictif a été ouvert, permettant aux utilisateurs de parier à l’avance sur le gagnant. En même temps, la bibliothèque de code des standards d’évaluation est open source, permettant aux développeurs de vérifier eux-mêmes les résultats, cette transparence est considérée comme sérieuse dans l’industrie.
Pour ceux qui s’intéressent à la sécurité Web3 et aux avancées de l’IA, ces résultats d’évaluation peuvent éclairer certains points — quels modèles sont réellement adaptés pour faire office de “médecins généralistes” pour les contrats intelligents. Les résultats du Q1 devraient être connus très bientôt.