GLM-5.1 ocupa el primer lugar en la lista de código de LMArena que se ha publicado como código abierto, y es el tercero a nivel mundial.

Noticias de Gate News. 10 de abril. Hoy, la plataforma global de evaluación autorizada de IA LMArena (plataforma de evaluación de modelos de IA basada en pruebas a ciegas con participación de millones de usuarios) actualizó el ranking especializado Code Arena. GLM-5.1 ocupa el primer lugar entre los modelos de código abierto a nivel global y el tercero a nivel mundial.

GLM-5.1 no solo hereda las capacidades de codificación SOTA de código abierto de la generación anterior, sino que también logra un avance en tareas de largo alcance (Long-Horizon Task), consiguiendo: construir un escritorio Linux desde cero en 8 horas; 655 iteraciones para superar el cuello de botella de optimización de las bases de datos vectoriales; y 1000 rondas de optimización de llamadas a herramientas para ajustarse a cargas reales de modelos de aprendizaje automático.

Cabe destacar que, bajo los mismos criterios de evaluación del ranking METR, GLM-5.1 es el único modelo de código abierto que alcanza un trabajo continuo de nivel de 8 horas, y es, a nivel global, uno de los pocos modelos que cuentan con esta capacidad, además de Claude Opus 4.6.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios