Duelo de modelos de IA: ¿quién podrá ganar la batalla por la seguridad de los contratos inteligentes en Web3?

robot
Generación de resúmenes en curso

【CriptoMundo】Llegó 2026, y el campo de la seguridad en IA también enfrenta una gran prueba: LISABench anuncia el inicio de una evaluación importante en el primer trimestre. Esta no es una simulación, sino una prueba real para determinar qué modelos de IA son los más efectivos en la detección de vulnerabilidades en contratos inteligentes Web3.

Echa un vistazo a la lista de participantes, que es prácticamente el “Dream Team” mundial en el campo de la IA: KIMI K2, DeepSeek V3.2, QWen 3, GLM 4.6, GPT-5.2, Gemini-3-pro-preview, Claude 4.5. Siete modelos de vanguardia compiten en igualdad de condiciones. Desde China, con Moonshot, DeepSeek, Alibaba, Zhipu, hasta internacionales como OpenAI, Google y Anthropic, esta evaluación tiene un alcance realmente lujoso.

Lo más interesante es que LISABench también ha incorporado interacción comunitaria. Se ha habilitado un canal de votación predictiva, donde los usuarios pueden apostar por quién creen que ganará. Además, han abierto el código del estándar de evaluación para que los desarrolladores puedan verificar los resultados por sí mismos. Este nivel de transparencia es bastante serio en la industria.

Para quienes están atentos a la seguridad en Web3 y los avances en IA, los resultados de esta evaluación pueden aclarar algunas dudas: qué modelos son adecuados para actuar como “médicos de chequeo” en contratos inteligentes. Los resultados del primer trimestre seguramente se conocerán muy pronto.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 10
  • Republicar
  • Compartir
Comentar
0/400
GasDevourervip
· 01-08 04:15
DeepSeek realmente viene con todo esta vez, ¿puede la versión V3.2 superar a GPT-5.2? DeepSeek vuelve a causar revuelo, esa es la velocidad que me gusta. En cuanto a auditoría de contratos, los modelos nacionales no deben ser subestimados, son bastante interesantes. Los siete en competencia, a ver quién es el más resistente, parece que será muy sangriento. Si esta vez DeepSeek gana la evaluación, OpenAI se quedará en ridículo. LISABench va en serio esta vez, esperando ver los momentos de desastre. La oportunidad para que los modelos nacionales se enorgullezcan ha llegado, hay que seguirlo de cerca.
Ver originalesResponder0
BakedCatFanboyvip
· 01-07 20:18
¿Podrá DeepSeek dar la vuelta esta vez? Parece que lo han alabado demasiado.
Ver originalesResponder0
NftRegretMachinevip
· 01-07 11:05
¿Otra vez la competencia de modelos de IA? ¿Esta vez realmente se podrá distinguir quién es confiable? ¿DeepSeek podrá dar la vuelta a la situación esta vez? El elenco de modelos nacionales todavía está bien, pero no sé cómo serán en realidad Esperemos a que salgan los resultados, hay muchas evaluaciones En cuanto a la detección de contratos inteligentes, todavía hay que confiar en los registros de seguridad reales y comprobados ¿GLM podrá superar a Claude? Apostaría cinco yuanes que no Para ser sincero, la mayoría de los grandes modelos están exagerando, pocos son realmente útiles De estos siete modelos, hay dos que ni siquiera he oído, ¿ha avanzado realmente el círculo Web3?
Ver originalesResponder0
WenMoon42vip
· 01-07 08:34
¿Podrá DeepSeek esta vez? Parece que los modelos nacionales han estado en auge últimamente.
Ver originalesResponder0
ChainSpyvip
· 01-05 04:50
¿Podrá DeepSeek derrotar a GPT esta vez? Parece que los modelos nacionales realmente han avanzado en estos dos años.
Ver originalesResponder0
MetaMaximalistvip
· 01-05 04:50
ngl este es exactamente el tipo de referencia de sostenibilidad del protocolo que hemos estado necesitando durante años... pero déjame ser realista, la mayoría de estos modelos probablemente van a tener dificultades con los vectores de ataque matizados que solo los primeros adoptantes realmente entienden
Ver originalesResponder0
UncleWhalevip
· 01-05 04:34
DeepSeek又来搞事情了,这次真的能行吗? --- ¿Detección de vulnerabilidades en contratos? En realidad, todo depende de qué modelo sea más inteligente. ¿Podrá DeepSeek dar la vuelta a la situación esta vez? Jaja --- Siete grandes modelos compitiendo entre sí, solo quiero ver quién será el primero en ser descubierto con problemas... --- Espera, ¿los modelos nacionales también pueden compararse con GPT5? Esta línea de tiempo va un poco rápido. --- Otra carrera armamentística, al final los que más se benefician son los equipos que realmente trabajan en seguridad. --- Preguntar es que DeepSeek es el más estable, los demás solo acompañan. --- En la seguridad Web3, solo tener IA no basta, también se necesita revisión humana para que sea confiable. --- ¿Cuánto tardará en salir este resultado de la evaluación...? ¿Podrían hacerlo más rápido? Estoy desesperado.
Ver originalesResponder0
bridge_anxietyvip
· 01-05 04:26
¿DeepSeek puede hacer algo diferente esta vez?
Ver originalesResponder0
MetaverseMortgagevip
· 01-05 04:25
DeepSeek vuelve, esta vez a ver si realmente puede resolver el problema de las vulnerabilidades en los contratos Este equipo realmente es bastante fuerte, pero cómo funcione en la práctica todavía depende de los datos Finalmente alguien se atreve a hacer una verdadera prueba de estrés a estos modelos, esperando los resultados La verdad, en seguridad Web3 este tipo de modelos de IA todavía no son muy confiables, a ver qué pasa KIMI y Claude, si se enfrentan, debería ser interesante, apuesto cinco dólares a que Claude se va a caer Ah... siete modelos en acción, parece una gran batalla, está un poco desordenado La seguridad de los contratos no se puede confiar solo en la detección con IA, todavía se necesita auditoría manual como respaldo Finalmente, los modelos nacionales pueden competir en esta carrera, tengo algo de expectativa ¿En serio? ¿Ya salió GPT-5.2? ¿Por qué no lo había oído? LISABench hizo un buen trabajo en esta campaña de marketing, definitivamente está en tendencia
Ver originalesResponder0
Ver más
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)