تُصدر NVIDIA وMIT إطار Lightning OPD، ما يعزز كفاءة تقطير النماذج 4 مرات مع القضاء على مشكلات ذاكرة وحدة معالجة الرسوميات

وبحسب تقارير، أطلق باحثون من NVIDIA ومعهد ماساتشوستس للتكنولوجيا Lightning OPD (Offline On-Policy Distillation)، وهو إطار عمل جديد لما بعد التدريب لنماذج اللغات الكبيرة يُلغي الحاجة إلى إبقاء نموذج المعلم قيد التشغيل أثناء التدريب. ومن خلال المعالجة المسبقة لاحتمالات السجل الخاصة بنموذج المعلم دون اتصال بالإنترنت، يعزز الإطار كفاءة التدريب بمقدار 4 أضعاف، مع تحرير جميع موارد وحدات معالجة الرسومات للتدريب على نموذج الطالب.

وبالاختبار على 8 وحدات NVIDIA H100 GPU، نجح Lightning OPD في تقطير Qwen3-30B-A3B-Base (وهو نموذج MoE تبلغ معلماته 30 ملياراً) وحقق 71.0 في معيار AIME 2024، في حين تعذر على OPD القياسي العمل بسبب نفاد الذاكرة على الأجهزة نفسها. وبالنسبة لنموذج Qwen3-8B الأصغر، تطلب الإطار 30 ساعة GPU فقط للوصول إلى 69.9 نقطة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

فريق كايمنغ هي من MIT يُصدر نموذجًا لتوسيع اللغة ELF بتدريب على 45 مليار رمز تدريب

بحسب Beating، أصدرت مؤخرًا فرق كيمينغ هي من معهد ماساتشوستس للتكنولوجيا نموذج ELF (Embedded Language Flows)، وهو نموذج لنشر اللغة ينحرف عن أسلوب التنبؤ التتابعي بـ"التنبؤ بالرمز التالي" المستخدم في نماذج من نمط GPT. وبدلًا من ذلك، يجري ELF توليد النص في فضاء تضمينات مستمر، ولا يحوِّله إلى رموز متقطعة إلا في الخطوة الأخيرة. في اختبارات التوليد غير المشروط ضمن OpenWebText، حقق ELF-B، الذي يضم 105M من المعلمات، حوالي 24.1 من مقلوبية التوليد (Gen. PPL) مع أخذ عينات على 32 خطوة، متفوقًا على عدة نماذج

GateNewsمنذ 38 د

أندرو نغ: «لن تُفضي الذكاء الاصطناعي إلى موجة بطالة واسعة»، والتوظيف في قطاع البرمجيات لا يزال قوياً

أبرز علماء مجال الذكاء الاصطناعي، ومؤسس DeepLearning.AI، أندرو نغ (و أوينداتا) كتب في 12 مايو على X والنشرة الإلكترونية The Batch، ليدّعي أن «الذكاء الاصطناعي لن يُفضي إلى موجة بطالة جماعية (jobpocalypse)»، في رد مباشر على سردية الخوف السائدة من فقدان الوظائف. وفقاً لرسالة نغ الأصلية على X، حققت هذه المنشورة أكثر من 2,600 إعجاب، وهي واحدة من أكثر وجهات النظر تداولاً في مجال الذكاء الاصطناعي خلال ذلك الأسبوع. الحجة الأساسية لدى نغ: توظيف هندسة البرمجيات ما زال قوياً، ومعدل البطالة ثابت عند 4.3% د

ChainNewsAbmediaمنذ 1 س

سيطلق رُقاقات Kunlun Chip من شركة بايدو، عقدة عمود Tian Chi المكوّنة من 256 بطاقة، في يونيو مع تحسين بنسبة 25% في الإنتاجية

استناداً إلى بايدو، في 13 مايو خلال مؤتمر المطورين Create 2026، أعلنت الشركة أن خادِمها الفائق Kunlun Chip Tian Chi المكوّن من 256 بطاقة سيُطلق رسمياً في يونيو، مع تحسين أداء الإنتاجية بنسبة 25% مقارنةً بالجيل السابق، وتعزيز كفاءة الاستدلال بنسبة 50%. أكمل الخادِم الفائق عملية التكيّف مع النماذج السائدة بما في ذلك Wenxin وDeepSeek وGLM وMiniMax، مع تحسين زمن الوصول من طرف إلى طرف بنسبة 50% عبر ترقية معمارية شبكة HPN 5.0. ويدعم بناء عناقيد تتراوح من عشرات الآلاف إلى ملايين البطاقات عند الطلب.

GateNewsمنذ 1 س

سعر طرح "IPO" لشركة Cerebras أعلى من نطاق 150-160 دولاراً، ويجمع 4.8 مليار دولار مع طلب هائل

وفقاً لـ Bloomberg، من المقرر أن تضع Cerebras Systems سعر طرحها الأولي للاكتتاب العام فوق نطاق 150-160 دولاراً أمريكياً في 13 مايو 2026، مع تصاعد الطلب على بيع الأسهم بأكثر من 20 ضعفاً مقارنة بالأسهم المتاحة. تُتيح شركة تصنيع شرائح الذكاء الاصطناعي 30 مليون سهم، ومن المتوقع أن ترفع 4.8 مليار دولار عند الحد الأعلى للنطاق، لتصبح أكبر طرح أولي في الولايات المتحدة هذا العام باستثناء الطروحات الخاصة. وأعلنت الشركة عن صافي دخل بلغ 87.9 مليون دولار على إيرادات قدرها 510 ملايين دولار في 2025، مقارنة بخس

GateNewsمنذ 1 س

ميتا تعرض روبوتات دردشة ذكاء اصطناعي منافسة إمكانية الوصول المجاني عبر واتساب لمدة شهر لتفادي غرامة محتملة من الاتحاد الأوروبي بسبب مخالفة قواعد مكافحة الاحتكار

وفقاً لوكالة Reuters، عرضت Meta على منافسيها من روبوتات الدردشة الذكية في المنطقة الاقتصادية الأوروبية (EEA) شهراً واحداً من الوصول المجاني إلى WhatsApp Business API كجزء من جهودها لتسوية تحقيق لمكافحة الاحتكار في الاتحاد الأوروبي قد يؤدي إلى فرض غرامات تصل إلى 10% من إجمالي المبيعات العالمية السنوية. وقالت المفوضية الأوروبية، التي أشارت في أبريل إلى أنها قد تفرض إتاحة الوصول بعد أن قيّدت Meta WhatsApp بذكائها الاصطناعي في يناير ثم فتحت الوصول للمنافسين مقابل رسوم في مارس، إن العرض خطوة في الاتج

GateNewsمنذ 1 س

تطلق Xero تكامل Claude في 13 مايو

بحسب Xero، أطلقت الشركة تكاملًا حيًا مع Claude التابع لـ Anthropic في 13 مايو يتيح للمشتركين حول العالم استخدام بيانات Xero داخل Claude.ai. تعرض الميزة أرقامًا آنية مثل وضع النقدية، والفواتير المستحقة، والإيرادات، والذمم المدينة، مع ربط الردود مرة أخرى بسجلات Xero. وقالت Xero إن البيانات التي يتم مشاركتها في هذا التكامل تُستخدم فقط لكل جلسة ولا تُستخدم لتدريب نماذج Claude.

GateNewsمنذ 1 س
تعليق
0/400
لا توجد تعليقات