Новини Gate News, 10 квітня. Сьогодні глобальна авторитетна платформа для оцінювання ШІ LMArena (платформа для оцінювання моделей ШІ з сліпими тестами за участі мільйонів користувачів) оновила спеціальний рейтинг Code Arena: GLM-5.1 посів перше місце серед глобальних відкритих моделей із відкритим кодом і третє місце серед глобальних моделей.
GLM-5.1 не лише успадкував відкритий SOTA-кодинг попереднього покоління моделей, але й досяг прориву в задачах із довгостроковою перспективою (Long-Horizon Task), реалізувавши: 8 годин для побудови з нуля Linux-робочого столу; 655 ітерацій, що подолали вузьке місце оптимізації в векторних базах даних; 1000 раундів оптимізації викликів інструментів для реального робочого навантаження ML-моделі.
Варто зазначити, що за однакових критеріїв оцінювання в рейтинговому списку METR GLM-5.1 є єдиною відкритою моделлю, яка досягає рівня безперервної роботи тривалістю 8 годин, а також однією з небагатьох моделей у всьому світі, окрім Claude Opus 4.6, що має таку здатність.