MiniMax M2.7 يجلب نموذج ذكاء اصطناعي ب230 مليار معلمة إلى بنية NVIDIA

AsiaTokenFund · 2026-04-13T00:50:08+00:00

MiniMax أطلقت M2.7، نموذج ذكاء اصطناعي ب230 مليار معلمة مُحسّن لوحدات معالجة الرسومات من NVIDIA، ويتميز بمعدل تنشيط بنسبة 4.3% من خلال بنية خبراء مختلطين. يُحسن معدل المعالجة بنسبة تصل إلى 2.7 ضعف على أجهزة Blackwell، مستهدفًا سير عمل مستقل معقد.

AsiaTokenFund

2026-04-13 00:50:08

إنشاء الملخص قيد التقدم

تيد هيسوكاوا

12 أبريل 2026 01:37

أصدرت شركة MiniMax نسخة M2.7، وهي نموذج مختلط من الخبراء بوزن 230 مليار معلمة محسّن لوحدات معالجة الرسومات من NVIDIA مع زيادات في الإنتاجية تصل إلى 2.7 ضعف على أجهزة بلاكويل.

أصدرت شركة MiniMax نموذج M2.7، وهو نموذج ذكاء اصطناعي مفتوح الوزن بوزن 230 مليار معلمة مصمم خصيصًا لعمليات الوكيل المستقلة، متاح الآن عبر نظام استنتاج NVIDIA بما في ذلك أحدث وحدات معالجة الرسومات بلاكويل ألترا.

يمثل النموذج خطوة هامة نحو الكفاءة في الذكاء الاصطناعي المؤسسي. على الرغم من حجمه الهائل الذي يبلغ 230 مليار معلمة، فإن M2.7 ينشط فقط 10 مليارات معلمة لكل رمز—معدل تفعيل بنسبة 4.3% يتم تحقيقه من خلال بنية مختلط من الخبراء (MoE) مع 256 خبير محلي. هذا يحافظ على تكاليف الاستنتاج مع الحفاظ على قدرة التفكير لنموذج أكبر بكثير.

أرقام الأداء على بلاكويل

تعاونت NVIDIA مع مجتمعات المصادر المفتوحة لتحسين M2.7 لأعباء العمل الإنتاجية. أدت تحسينات رئيسية—نواة دمج QK RMS Norm ودمج FP8 MoE من TensorRT-LLM—إلى تحسينات كبيرة في الإنتاجية على وحدات معالجة الرسومات بلاكويل ألترا.

اختبار باستخدام مجموعة بيانات بطول تسلسل إدخال/إخراج 1K/1K أظهر أن vLLM حقق زيادة في الإنتاجية تصل إلى 2.5 ضعف، بينما حقق SGLang زيادة قدرها 2.7 ضعف. تم تنفيذ كلا التحسينين خلال شهر واحد، مما يشير إلى وجود مجال لتحسين الأداء أكثر.

الهيكلية التقنية

يدعم M2.7 طول سياق إدخال يصل إلى 200 ألف عبر 62 طبقة، باستخدام انتباه ذاتي سببي متعدد الرؤوس مع تضمينات موضعية دوارة (RoPE). آلية توجيه الخبراء من نوع top-k تنشط فقط 8 من الخبراء الـ256 لأي إدخال معين، وهو ما يحافظ على انخفاض تكاليف الاستنتاج رغم حجمه.

يستهدف الهيكل تحديات الترميز والمهام المعقدة التي تتطلب وكيلًا—وهو سير عمل حيث تحتاج أنظمة الذكاء الاصطناعي إلى التخطيط والتنفيذ والتكرار بشكل مستقل بدلاً من الاستجابة لموجه واحد.

خيارات النشر

يمكن للمطورين الوصول إلى M2.7 عبر قنوات متعددة. يوفر إطار عمل NemoClaw من NVIDIA نشرًا بنقرة واحدة لتشغيل وكلاء مستقلين باستخدام بيئة OpenShell. النموذج متاح أيضًا من خلال حاويات NIM من NVIDIA للخدمات المصغرة المعبأة للحوسبة المحلية أو السحابية أو الهجينة.

للفرق التي ترغب في تخصيص النموذج، يدعم مكتبة NeMo AutoModel من NVIDIA التخصيص الدقيق باستخدام وصفات منشورة. تتوفر سير عمل التعلم المعزز من خلال NeMo RL مع تكوينات عينة لطول تسلسل 8K و16K.

تتيح نقاط النهاية المعززة بواسطة GPU المجانية على build.nvidia.com الاختبار قبل الالتزام بالبنية التحتية. كما تتوفر الأوزان المفتوحة على Hugging Face للنشر الذاتي.

تضع النسخة الجديدة MiniMax كبديل موثوق به للنماذج المغلقة من OpenAI وAnthropic للمؤسسات التي تبني أنظمة ذكاء اصطناعي مستقلة، خاصة تلك التي استثمرت بالفعل في بنية NVIDIA التحتية.

مصدر الصورة: Shutterstock

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
GateFounderDrHan13thAnniversaryLetter
37.17K درجة الشعبية
#
CryptoMarketsDipSlightly
168.33K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
29.32K درجة الشعبية
#
USBlocksStraitofHormuz
708.54K درجة الشعبية
#
AaveDAOApproves$25MGrant
1.8M درجة الشعبية

تثبيت

خريطة الموقع

MiniMax M2.7 يجلب نموذج ذكاء اصطناعي ب230 مليار معلمة إلى بنية NVIDIA

أرقام الأداء على بلاكويل

الهيكلية التقنية

خيارات النشر

المواضيع الرائجة

GateFounderDrHan13thAnniversaryLetter

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

USBlocksStraitofHormuz

AaveDAOApproves$25MGrant

تثبيت