Confronto de modelos de IA: quem pode vencer a batalha pela segurança de contratos inteligentes Web3?

robot
Geração de resumo em curso

【CriptoMundo】Chegou 2026, e o setor de segurança de IA também enfrenta um grande teste — a LISABench anunciou o início da avaliação importante do Q1. Desta vez, não é um exercício, mas um teste real para verificar quais modelos de IA são mais eficazes na detecção de vulnerabilidades em contratos inteligentes Web3.

Olhe para esta lista de participantes, é praticamente a “Dream Team” do setor de IA global: KIMI K2, DeepSeek V3.2, QWen 3, GLM 4.6, GPT-5.2, Gemini-3-pro-preview, Claude 4.5, sete modelos de ponta competindo entre si. Desde empresas nacionais como Moonshot, 深度求索, Alibaba, 智谱, até internacionais como OpenAI, Google, Anthropic, esta avaliação tem uma cobertura verdadeiramente de alto nível.

O mais interessante é que a LISABench também está promovendo interação comunitária. Foi aberta uma votação de previsão, onde os usuários podem apostar antecipadamente quem vai vencer. Além disso, o repositório de código dos critérios de avaliação foi open source, permitindo que os desenvolvedores verifiquem os resultados por conta própria — esse nível de transparência é considerado sério na indústria.

Para quem acompanha segurança Web3 e avanços em IA, os resultados desta avaliação podem esclarecer algumas questões — quais modelos são mais adequados para atuar como “médicos de check-up” de contratos inteligentes. Os resultados do Q1 devem estar disponíveis muito em breve.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 10
  • Republicar
  • Partilhar
Comentar
0/400
GasDevourervip
· 01-08 04:15
DeepSeek desta vez veio realmente com força, o V3.2 consegue superar o GPT-5.2? DeepSeek está mais uma vez a causar agitação, é o ritmo que eu gosto Na área de auditoria de contratos, os modelos nacionais realmente não podem ser subestimados, está interessante Todos os sete a testar, vamos ver qual é o mais resistente, parece que vai ser bastante sangrento Se nesta avaliação o DeepSeek vencer, a OpenAI vai ficar bastante envergonhada LISABench desta vez vai a sério, estou ansioso para ver os momentos de falha épica A oportunidade para os modelos nacionais se destacarem chegou, é preciso ficar atento
Ver originalResponder0
BakedCatFanboyvip
· 01-07 20:18
DeepSeek desta vez consegue dar a volta por cima, sinto que foi bastante elogiado.
Ver originalResponder0
NftRegretMachinevip
· 01-07 11:05
Mais uma competição de modelos de IA, será que desta vez conseguimos perceber quem é confiável? A DeepSeek consegue virar o jogo desta vez? A lineup de modelos nacionais ainda está razoável, só não sabemos como realmente funciona Vamos esperar pelos resultados, há muitas avaliações por aí Para a detecção de contratos inteligentes, ainda é preciso olhar para registros de segurança reais e confiáveis O GLM consegue superar o Claude? Aposto cinco euros que não Para ser honesto, muitos modelos grandes estão sendo exagerados, poucos realmente são utilizáveis Desses sete modelos, dois eu nunca ouvi falar, o mundo Web3 realmente avançou?
Ver originalResponder0
WenMoon42vip
· 01-07 08:34
Hum, a DeepSeek consegue vencer desta vez, parece que os modelos nacionais estão a ganhar força recentemente.
Ver originalResponder0
ChainSpyvip
· 01-05 04:50
DeepSeek desta vez consegue derrubar o GPT? Parece que os modelos nacionais realmente evoluíram nos últimos dois anos
Ver originalResponder0
MetaMaximalistvip
· 01-05 04:50
ngl esta é exatamente o tipo de benchmark de sustentabilidade de protocolo que temos vindo a precisar há anos... mas deixa-me ser honesto, a maioria destes modelos provavelmente vai ter dificuldades com os vetores de ataque mais complexos que só os primeiros utilizadores realmente compreendem
Ver originalResponder0
UncleWhalevip
· 01-05 04:34
A DeepSeek está aqui para voltar a fazer as coisas, será que desta vez vai mesmo funcionar? --- Deteção de vulnerabilidades em contratos? Para ser franco, depende de qual modelo é mais inteligente, será que a DeepSeek consegue ultrapassar esta onda haha? --- Sete modelos grandes rolam umas às outras, só quero ver quem é exposto no fim... --- Espera, os modelos domésticos também podem ser comparados com o GPT5? Esta linha temporal é um pouco rápida --- É mais uma corrida armamentista e, no fim, são as equipas que realmente fazem segurança --- A questão é que o DeepSeek é o mais estável, e os outros estão todos acompanhados --- A segurança Web3 não é suficiente apenas com IA, é necessário ter revisão humana para ser fiável --- Quanto tempo teremos de esperar até sair o resultado da avaliação... Podes despachar-te? Estou com pressa."
Ver originalResponder0
bridge_anxietyvip
· 01-05 04:26
deepseek desta vez consegue fazer algo diferente?
Ver originalResponder0
MetaverseMortgagevip
· 01-05 04:25
DeepSeek voltou, desta vez para ver se consegue realmente resolver o problema das vulnerabilidades de contratos Este elenco é realmente forte, mas ainda temos que ver como funciona na prática com base nos dados Finalmente alguém que se atreve a fazer um teste de resistência real a esses modelos, aguardando os resultados Para ser honesto, o modelo de IA na segurança Web3 ainda não é confiável, vamos esperar para ver a piada KIMI e Claude vão ser interessantes se entrarem em confronto, aposto cinco euros que Claude vai falhar Ah... sete modelos ao mesmo tempo, parece uma batalha de rua, está meio confuso A segurança de contratos não pode depender apenas da detecção por IA, ainda é preciso auditoria manual como lastro Modelos nacionais finalmente podem competir nesta área, estou um pouco ansioso Sério? O GPT-5.2 já foi lançado? Como é que eu não ouvi falar? LISABench fez uma boa campanha, o hype está garantido
Ver originalResponder0
Ver mais
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)