أطلقت Mistral AI نموذج Leanstral: أول وكيل أكواد مفتوح المصدر في Lean 4، يمكنه إخراج الإثباتات الرسمية تلقائياً

Gate News أخبار، في 17 مارس، أطلقت Mistral AI اليوم Leanstral، وهو أول وكيل مفتوح المصدر مصمم خصيصًا لأداة التحقق الرسمي Lean 4. يتميز النموذج بابتكار رئيسي يتمثل في قدرته على إنتاج إثباتات رسمية يمكن لـ Lean 4 التحقق منها تلقائيًا، مما يتجاوز عنق الزجاجة التقليدي في مراجعة الكود اليدوية عند توليد الكود بواسطة الذكاء الاصطناعي.

يعتمد Leanstral على بنية MoE نادرة، ويحتوي على 120 مليار معلمة إجمالية و6 مليارات معلمة نشطة، وهو مفتوح المصدر بموجب رخصة Apache 2.0، وتم تحسين تدريبه بشكل خاص لـ lean-lsp-mcp. يمكن للمستخدمين تشغيله بسهولة عبر الأمر /leanstall في Mistral Vibe بدون إعداد، أو استدعاؤه عبر نقطة API مجانية labs-leanstral-2603، كما يدعم التحميل المحلي للأوزان للنشر الذاتي.

أطلقت Mistral أيضًا معيار تقييم جديد باسم FLTEval، والذي يستخدم مشروع التحقق الرسمي لنظرية فيرما الكبرى في مجتمع Lean 4 كبيئة اختبار. تظهر نتائج الأداء أن Leanstral pass@2 يكلف 36 دولارًا ويحصل على درجة 26.3، متفوقًا على Claude Sonnet 4.6 الذي يكلف 549 دولارًا ويحقق 23.7 نقطة؛ وpass@16 يكلف 290 دولارًا ويحقق 31.9 نقطة، متفوقًا على Sonnet 8 بنقطة واحدة، بينما يحتاج Claude Opus 4.6 إلى 1,650 دولارًا لتحقيق 39.6 نقطة. في النماذج مفتوحة المصدر، يحتاج Qwen3.5-397B-A17B إلى 4 عمليات تشغيل لتحقيق 25.4 نقطة، وهو أدنى من أداء Leanstral pass@2.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات