🔥رابد لابز تطلق خطة مشاركة الذاكرة متعددة الوكيلات Latent Briefing، مع تقليل استهلاك الرموز Token بنسبة تصل إلى 65٪


في 11 أبريل، أصدرت شركة البنية التحتية للذكاء الاصطناعي Ramp Labs نتائج بحثها "Latent Briefing"، والتي تحقق مشاركة ذاكرة فعالة بين أنظمة الوكيلات المتعددة من خلال ضغط مخزن KV للنموذج الكبير مباشرة، مع تقليل استهلاك الرموز بشكل كبير دون فقدان الدقة. في بنية الوكيلات المتعددة السائدة، يقوم المنسق (Orchestrator) بتقسيم المهام واستدعاء نماذج العاملين (Worker) بشكل متكرر، ومع استمرار تمديد سلسلة الاستنتاج، يتضخم استهلاك الرموز بشكل أسي. الفكرة الأساسية لـ Latent Briefing هي: باستخدام آلية الانتباه لتحديد…
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.35Kعدد الحائزين:2
    0.45%
  • القيمة السوقية:$2.37Kعدد الحائزين:2
    0.42%
  • القيمة السوقية:$2.29Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.35Kعدد الحائزين:2
    0.35%
  • تثبيت