Gate News Meldung, 10. April, heute hat die globale, angesehene KI-Bewertungsplattform LMArena (KI-Modell-Bewertungsplattform, bei der Millionen Nutzer an Blindtests teilnehmen) die Code-Arena-Spezialrangliste aktualisiert: GLM-5.1 belegt den ersten Platz bei den globalen Open-Source-Modellen und rangiert auf Platz drei unter allen globalen Modellen.
GLM-5.1 übernimmt nicht nur die Open-Source-SOTA-Codierungsfähigkeiten der vorherigen Modellgeneration, sondern erzielt auch bei langfristigen Aufgaben (Long-Horizon Task) Durchbrüche und erreicht: 8 Stunden, um eine Linux-Desktop-Umgebung von Grund auf aufzubauen; 655 Iterationen, die den Engpass bei der Optimierung von Vektor-Datenbanken durchbrechen; 1000 Runden von Tool-Aufrufen zur Optimierung der echten Machine-Learning-Modell-Auslastung.
Bemerkenswert ist außerdem, dass GLM-5.1 unter den gleichen Bewertungsstandards der METR-Rangliste das einzige Open-Source-Modell ist, das eine durchgehende Leistung auf dem Niveau von 8 Stunden erreicht, und weltweit – abgesehen von Claude Opus 4.6 – nur wenige Modelle über diese Fähigkeit verfügen.