Повідомлення Gate News, 27 квітня — команда Xiaomi MiMo оприлюднила з відкритим кодом серію MiMo-V2.5 великих мовних моделей під ліцензією MIT, що підтримує комерційне розгортання, подальше навчання та доопрацювання. Обидві моделі мають контекстне вікно розміром 1 мільйон токенів. MiMo-V2.5-Pro — це модель суміші експертів із чистим текстом (MoE) з 1,02 трильйонами загальних параметрів і 42 мільярдами активних параметрів, тоді як MiMo-V2.5 — нативна мультимодальна модель із 310 мільярдами загальних параметрів і 15 мільярдами активних параметрів, що підтримує розуміння тексту, зображень, відео та аудіо.
MiMo-V2.5-Pro орієнтована на складні агентні та програмістські задачі. У бенчмарках ClawEval вона досягла 64% Pass@3, споживаючи приблизно 70 000 токенів на траєкторію задачі — на 40%–60% менше токенів, ніж Claude Opus, Gemini 3.1 Pro та GPT-5.4. Модель набрала 78,9 на SWE-bench Verified. У демонстрації V2.5-Pro самостійно реалізувала повний компілятор SysY-to-RISC-V для проєкту курсу компіляторів Пекінського університету за 4,3 години, використавши 672 виклики інструментів, і досягла ідеального результату 233/233 на прихованих тестових наборах.
MiMo-V2.5 призначена для сценаріїв мультимодальних агентів, оснащена виділеним візуальним енкодером (729 мільйонів параметрів) та аудіоенкодером (261 мільйон параметрів), набравши 62,3 на Claw-Eval загальному піднаборі. Обидві моделі використовують гібридну архітектуру, що поєднує sliding window attention (SWA) та глобальну увагу (GA), разом із модулем 3-шарової багатотокенної передбачуваності (MTP) для прискореного виведення. Ваги моделі доступні на Hugging Face.
Поряд із випуском із відкритим кодом команда MiMo запустила «Orbit Quadrillion Token Creator Incentive Program», пропонуючи 100 квадрильйонів токенів безкоштовно протягом 30 днів для користувачів у всьому світі. Окремі розробники, команди та підприємства можуть подати заявку через сторінку програми, з циклом оцінювання приблизно 3 робочих дні; схвалені переваги розподіляються як Token Plans або прямі кредити, сумісні з інструментами на кшталт Claude Code та Cursor.
Пов'язані статті
Meta Reserves 1GW+ Сонячної енергії та накопичення енергії для дата-центрів ШІ
Zhipu Z.ai продовжує промоакцію «потрійна квота» в GLM Coding Plan до 30 червня
TSMC прискорює розширення вдвічі швидше: п’ять виробництв 2 нм виходять на повну потужність у 2026 році
Copilot від GitHub переходить на облік за токенами з 1 червня, щомісячні внески без змін
Регулятори Китаю блокують придбання Manus Meta на $2 мільярда