نظرة جديدة على دمج قدرات الصوت المتقدمة في الروبوتات—واجهه برمجة التطبيقات الصوتية الخاصة بـ Grok ظهرت لأول مرة في عرض روبوت، والنتائج مثيرة للاهتمام جدًا. الأداء الفني يتحدث عن نفسه: يتفوق على Big Bench Audio، وهو أكثر معايير الصناعة صرامة لمهام الاستدلال الصوتي. هذا النوع من الاختراق يمكن أن يعيد تشكيل ما هو ممكن مع الوكلاء الذاتيين في مجال الروبوتات. الوكلاء المدعومون بالصوت ليسوا أذكى فقط؛ إنهم أكثر بديهية وعمليين للنشر في العالم الحقيقي. لا تزال الأيام مبكرة، لكن الأساس قوي لبعض التطبيقات المثيرة في المستقبل.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 3
  • إعادة النشر
  • مشاركة
تعليق
0/400
BlockchainGrillervip
· منذ 20 س
grok هذه الموجة من واجهة برمجة التطبيقات الصوتية فعلاً قوية، تتفوق مباشرة على معيار الاختبار الصوتي الكبير، والروبوتات أصبحت قادرة على فهم كلام الإنسان، هل نشعر أن عصر الوكيل المستقل يقترب مرة أخرى؟
شاهد النسخة الأصليةرد0
SilentObservervip
· منذ 20 س
واجهة برمجة التطبيقات الصوتية لـ grok فعلاً قوية، لكن السيناريوهات التي يمكن تطبيقها فعليًا لا تزال بحاجة إلى الانتظار والمراقبة. الآن كله مجرد عروض تجريبية وتضخيم، فهل هناك منتج فعلي؟
شاهد النسخة الأصليةرد0
Gm_Gn_Merchantvip
· منذ 20 س
واجهة برمجة تطبيقات صوت grok حقًا مذهلة، ويمكن ملاحظة أن أداء روبوت العرض التوضيحي يظهر أن التقنية قوية حقًا. النماذج الكبيرة تتجه نحو الروبوتات، وربما الآن ستنطلق الوكالة الذاتية.
شاهد النسخة الأصليةرد0
  • Gate Fun الساخنعرض المزيد
  • القيمة السوقية:$3.43Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.45Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.53Kعدد الحائزين:3
    0.48%
  • القيمة السوقية:$3.49Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.48Kعدد الحائزين:1
    0.00%
  • تثبيت