Tin cổng, ngày 27 tháng 4 — Nhóm MiMo của Xiaomi đã phát hành mã nguồn mở cho dòng mô hình ngôn ngữ lớn MiMo-V2.5 theo giấy phép MIT, hỗ trợ triển khai thương mại, huấn luyện tiếp tục và tinh chỉnh. Cả hai mô hình đều có cửa sổ ngữ cảnh 1 triệu token. MiMo-V2.5-Pro là mô hình mixture-of-experts văn bản thuần (MoE) với tổng cộng 1,02 nghìn tỷ tham số và 42Bỷ tham số hoạt động, trong khi MiMo-V2.5 là mô hình đa phương thức gốc với tổng cộng 1Mỷ tham số và 310Bỷ tham số hoạt động, hỗ trợ hiểu văn bản, hình ảnh, video và âm thanh.
MiMo-V2.5-Pro nhắm đến các tác vụ tác nhân phức tạp và lập trình. Trong các benchmark ClawEval, nó đạt 64% Pass@3 trong khi tiêu thụ khoảng 70.000 token cho mỗi quỹ đạo tác vụ—ít hơn 40% đến 60% token so với Claude Opus, Gemini 3.1 Pro và GPT-5.4. Mô hình đạt 78,9 trên SWE-bench Verified. Trong một bản demo, V2.5-Pro tự độc lập triển khai hoàn chỉnh bộ biên dịch SysY-to-RISC-V cho một dự án môn học của Đại học Bắc Kinh trong 4,3 giờ với 672 lần gọi công cụ, đạt điểm tuyệt đối 233/233 trên các tập kiểm thử ẩn.
MiMo-V2.5 được thiết kế cho các kịch bản tác nhân đa phương thức, được trang bị bộ mã hóa tầm nhìn chuyên dụng (729 triệu tham số) và bộ mã hóa âm thanh (261 triệu tham số), đạt 62,3 trên phân tập tổng quát Claw-Eval. Cả hai mô hình đều sử dụng kiến trúc lai kết hợp cơ chế chú ý cửa sổ trượt (SWA) và chú ý toàn cục (GA), đi kèm module dự đoán đa token 3 lớp (MTP) để tăng tốc suy luận. Trọng số mô hình có sẵn trên Hugging Face.
Cùng với bản phát hành mã nguồn mở, nhóm MiMo đã ra mắt “Chương trình ưu đãi Orbit Quadrillion Token Creator Incentive Program”, cung cấp 100 nghìn tỷ token miễn phí trong 30 ngày cho người dùng trên toàn cầu. Các nhà phát triển cá nhân, đội nhóm và doanh nghiệp có thể đăng ký thông qua trang chương trình với chu kỳ đánh giá khoảng 3 ngày làm việc; các lợi ích được phê duyệt sẽ được phân phối dưới dạng Token Plans hoặc tín dụng trực tiếp, tương thích với các công cụ như Claude Code và Cursor.
Bài viết liên quan
Meta Dự trữ 1GW+ Điện Mặt Trời và Lưu Trữ Năng Lượng cho các Trung Tâm Dữ Liệu AI
Zhipu Z.ai Gia hạn Chương trình khuyến mãi Gấp ba Hạn mức của GLM Coding Plan đến ngày 30 tháng 6
TSMC Đẩy Mạnh Mở Rộng Với Tốc Độ Gấp Đôi, Năm Nhà Máy 2nm Sẽ Tăng Sản Xuất vào Năm 2026
GitHub Copilot Chuyển Sang Thanh Toán Dựa Trên Token Bắt Đầu Từ Ngày 1 Tháng 6, Phí Hàng Tháng Không Đổi
Các Cơ quan Quản lý Trung Quốc chặn thương vụ mua lại Manus trị giá $2 Billion của Meta