【CriptoMundo】Chegou 2026, e o setor de segurança de IA também enfrenta um grande teste — a LISABench anunciou o início da avaliação importante do Q1. Desta vez, não é um exercício, mas um teste real para verificar quais modelos de IA são mais eficazes na detecção de vulnerabilidades em contratos inteligentes Web3.
Olhe para esta lista de participantes, é praticamente a “Dream Team” do setor de IA global: KIMI K2, DeepSeek V3.2, QWen 3, GLM 4.6, GPT-5.2, Gemini-3-pro-preview, Claude 4.5, sete modelos de ponta competindo entre si. Desde empresas nacionais como Moonshot, 深度求索, Alibaba, 智谱, até internacionais como OpenAI, Google, Anthropic, esta avaliação tem uma cobertura verdadeiramente de alto nível.
O mais interessante é que a LISABench também está promovendo interação comunitária. Foi aberta uma votação de previsão, onde os usuários podem apostar antecipadamente quem vai vencer. Além disso, o repositório de código dos critérios de avaliação foi open source, permitindo que os desenvolvedores verifiquem os resultados por conta própria — esse nível de transparência é considerado sério na indústria.
Para quem acompanha segurança Web3 e avanços em IA, os resultados desta avaliação podem esclarecer algumas questões — quais modelos são mais adequados para atuar como “médicos de check-up” de contratos inteligentes. Os resultados do Q1 devem estar disponíveis muito em breve.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
13 gostos
Recompensa
13
10
Republicar
Partilhar
Comentar
0/400
GasDevourer
· 01-08 04:15
DeepSeek desta vez veio realmente com força, o V3.2 consegue superar o GPT-5.2?
DeepSeek está mais uma vez a causar agitação, é o ritmo que eu gosto
Na área de auditoria de contratos, os modelos nacionais realmente não podem ser subestimados, está interessante
Todos os sete a testar, vamos ver qual é o mais resistente, parece que vai ser bastante sangrento
Se nesta avaliação o DeepSeek vencer, a OpenAI vai ficar bastante envergonhada
LISABench desta vez vai a sério, estou ansioso para ver os momentos de falha épica
A oportunidade para os modelos nacionais se destacarem chegou, é preciso ficar atento
Ver originalResponder0
BakedCatFanboy
· 01-07 20:18
DeepSeek desta vez consegue dar a volta por cima, sinto que foi bastante elogiado.
Ver originalResponder0
NftRegretMachine
· 01-07 11:05
Mais uma competição de modelos de IA, será que desta vez conseguimos perceber quem é confiável?
A DeepSeek consegue virar o jogo desta vez?
A lineup de modelos nacionais ainda está razoável, só não sabemos como realmente funciona
Vamos esperar pelos resultados, há muitas avaliações por aí
Para a detecção de contratos inteligentes, ainda é preciso olhar para registros de segurança reais e confiáveis
O GLM consegue superar o Claude? Aposto cinco euros que não
Para ser honesto, muitos modelos grandes estão sendo exagerados, poucos realmente são utilizáveis
Desses sete modelos, dois eu nunca ouvi falar, o mundo Web3 realmente avançou?
Ver originalResponder0
WenMoon42
· 01-07 08:34
Hum, a DeepSeek consegue vencer desta vez, parece que os modelos nacionais estão a ganhar força recentemente.
Ver originalResponder0
ChainSpy
· 01-05 04:50
DeepSeek desta vez consegue derrubar o GPT? Parece que os modelos nacionais realmente evoluíram nos últimos dois anos
Ver originalResponder0
MetaMaximalist
· 01-05 04:50
ngl esta é exatamente o tipo de benchmark de sustentabilidade de protocolo que temos vindo a precisar há anos... mas deixa-me ser honesto, a maioria destes modelos provavelmente vai ter dificuldades com os vetores de ataque mais complexos que só os primeiros utilizadores realmente compreendem
Ver originalResponder0
UncleWhale
· 01-05 04:34
A DeepSeek está aqui para voltar a fazer as coisas, será que desta vez vai mesmo funcionar?
---
Deteção de vulnerabilidades em contratos? Para ser franco, depende de qual modelo é mais inteligente, será que a DeepSeek consegue ultrapassar esta onda haha?
---
Sete modelos grandes rolam umas às outras, só quero ver quem é exposto no fim...
---
Espera, os modelos domésticos também podem ser comparados com o GPT5? Esta linha temporal é um pouco rápida
---
É mais uma corrida armamentista e, no fim, são as equipas que realmente fazem segurança
---
A questão é que o DeepSeek é o mais estável, e os outros estão todos acompanhados
---
A segurança Web3 não é suficiente apenas com IA, é necessário ter revisão humana para ser fiável
---
Quanto tempo teremos de esperar até sair o resultado da avaliação... Podes despachar-te? Estou com pressa."
Ver originalResponder0
bridge_anxiety
· 01-05 04:26
deepseek desta vez consegue fazer algo diferente?
Ver originalResponder0
MetaverseMortgage
· 01-05 04:25
DeepSeek voltou, desta vez para ver se consegue realmente resolver o problema das vulnerabilidades de contratos
Este elenco é realmente forte, mas ainda temos que ver como funciona na prática com base nos dados
Finalmente alguém que se atreve a fazer um teste de resistência real a esses modelos, aguardando os resultados
Para ser honesto, o modelo de IA na segurança Web3 ainda não é confiável, vamos esperar para ver a piada
KIMI e Claude vão ser interessantes se entrarem em confronto, aposto cinco euros que Claude vai falhar
Ah... sete modelos ao mesmo tempo, parece uma batalha de rua, está meio confuso
A segurança de contratos não pode depender apenas da detecção por IA, ainda é preciso auditoria manual como lastro
Modelos nacionais finalmente podem competir nesta área, estou um pouco ansioso
Sério? O GPT-5.2 já foi lançado? Como é que eu não ouvi falar?
LISABench fez uma boa campanha, o hype está garantido
Confronto de modelos de IA: quem pode vencer a batalha pela segurança de contratos inteligentes Web3?
【CriptoMundo】Chegou 2026, e o setor de segurança de IA também enfrenta um grande teste — a LISABench anunciou o início da avaliação importante do Q1. Desta vez, não é um exercício, mas um teste real para verificar quais modelos de IA são mais eficazes na detecção de vulnerabilidades em contratos inteligentes Web3.
Olhe para esta lista de participantes, é praticamente a “Dream Team” do setor de IA global: KIMI K2, DeepSeek V3.2, QWen 3, GLM 4.6, GPT-5.2, Gemini-3-pro-preview, Claude 4.5, sete modelos de ponta competindo entre si. Desde empresas nacionais como Moonshot, 深度求索, Alibaba, 智谱, até internacionais como OpenAI, Google, Anthropic, esta avaliação tem uma cobertura verdadeiramente de alto nível.
O mais interessante é que a LISABench também está promovendo interação comunitária. Foi aberta uma votação de previsão, onde os usuários podem apostar antecipadamente quem vai vencer. Além disso, o repositório de código dos critérios de avaliação foi open source, permitindo que os desenvolvedores verifiquem os resultados por conta própria — esse nível de transparência é considerado sério na indústria.
Para quem acompanha segurança Web3 e avanços em IA, os resultados desta avaliação podem esclarecer algumas questões — quais modelos são mais adequados para atuar como “médicos de check-up” de contratos inteligentes. Os resultados do Q1 devem estar disponíveis muito em breve.