ساخن

شاهد النسخة الأصلية
Bykarantelivip
نيفيديا تصدر دليل تحسين Flash Attention لمعالجات Blackwell GPU
إطار عمل cuTile الجديد من نيفيديا يوفر تسريعًا بمقدار 1.6 مرة لـ Flash Attention على معالجات B200، مما يتيح استنتاج نماذج اللغة الكبيرة بسرعة أكبر وهو أمر حاسم للبنية التحتية للذكاء الاصطناعي. 🚀
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت