Kimi K2 Thinking установил новые рекорды в бенчмарках оценки логического мышления, кодирования и агентских способностей

Данные Jin10 8 ноября: согласно официальному сайту Yue Zhi An Mian, Kimi K2 Thinking установил новые рекорды в бенчмарках оценки логического мышления, кодирования и агентских способностей. K2 Thinking достиг 44.9% SOTA в бенчмарке HLE, 60.2% в тесте BrowseComp и 71.3% в тесте SWE-Bench Verified, демонстрируя мощные обобщающие способности как передовая модель агента мышления.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев