OpenClaw Gründer teilen die Rangliste der Anpassungsfähigkeit von KI-Modellen, wobei die inländischen Modelle minimax-m2.1 und kimi-k2.5 auf den Plätzen 2 und 3 liegen.

Gate News Nachrichten, 8. März: Peter Steinberger, Gründer von OpenClaw (KI-Proxy-Entwicklungsframework), teilt die Ergebnisse eines Benchmark-Tests eines Drittanbieters, PinchBench, der die Leistung großer KI-Sprachmodelle bei OpenClaw-Proxy-Aufgaben bewertet. Die Ergebnisse zeigen, dass Gemini 3 Flash mit einer Erfolgsquote von 95,1 % den ersten Platz belegt, während die inländischen Modelle minimax-m2.1 und kimi-k2.5 mit 93,6 % bzw. 93,4 % den zweiten und dritten Platz erreichen. Claude Sonnet 4.5 hat eine Erfolgsquote von 92,7 %, GPT-4o liegt bei 85,2 %.

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare