Google تطلق Gemini 3.1 Flash TTS مع تعبير عاطفي محسّن وقدرات تعدد المتحدثين

رسالة Gate News، 17 أبريل — كشفت Google النقاب عن Gemini 3.1 Flash TTS، وهو نموذج متقدم لتحويل النص إلى كلام مع ميزات محسنة للتعبير العاطفي والتحكم، في 15 أبريل. سيتم طرح النموذج الجديد تدريجيًا عبر واجهات برمجة التطبيقات للمطورين، وVertex AI الخاص بالمؤسسات، وأدوات التعاون.

تشمل القدرات الأساسية للنموذج وسومًا صوتية تعتمد على اللغة الطبيعية لضبط السرعة والتنغيم والعاطفة بدقة، إلى جانب “Director Mode” لتحديد المشاهد وأدوار الشخصيات من أجل توليد مخرجات صوتية أكثر دقة. تُمكّن ميزة تعدد المتحدثين من توليد الحوار بشكل متزامن، ما يسمح بتدفقات محادثة أكثر طبيعية ومناسبـة للبودكاست والمحتوى الصوتي ومساعدي الذكاء الاصطناعي. يدعم النموذج أكثر من 70 لغة ولهجة، ما يعكس اللهجات والتعبيرات الإقليمية لتجارب صوتية مخصصة عالميًا.

أكدت Google على الأداء وكفاءة التكلفة، محققة نتائج مرتفعة على معايير تقييم البشر العمياء مع تقليل التكاليف الحاسوبية عبر بنية Flash—المصممة لاعتماد المؤسسات على نطاق واسع. يتضمن الصوت المُولَّد ترميزًا مائيًا SynthID لتحديد المحتوى المُولَّد بالذكاء الاصطناعي ومكافحة المعلومات المضللة.

تعكس هذه الخطوة اشتداد المنافسة في واجهات الصوت. تقوم OpenAI بدمج ميزات الصوت في الوقت الفعلي مع الذكاء الاصطناعي الحواري من أجل تفاعلات شبيهة بالبشر، بينما توسع Meta استثماراتها في شخصيات الذكاء الاصطناعي مع تجارب اجتماعية قائمة على الصوت. يلاحظ مراقبون في الصناعة أنه بينما قد يبقى مستوى عالٍ من التمثيل والعمل الإبداعي مدفوعًا بالبشر في الوقت الحالي، قد يشهد سوق الإنتاج المتكرر وعلى نطاق واسع تبنّيًا تدريجيًا للذكاء الاصطناعي في مجالات الدبلجة والإعلانات وسلاسل الكتب الصوتية.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

كشف تسريب البيانات أن "كلود" قد لا يكون ذكيًا بشكل كافٍ، وأن ذلك ليس مجرد قصة شائعة في المدينة، فالنماذج الذكية غير مستقرة وتشكل مخاطر على الشركات

يتناول المقال ظاهرة عدم استقرار أداء نماذج LLM (النماذج اللغوية الكبيرة) في تطبيقات الشركات للذكاء الاصطناعي، ويطلق عليها اسم «خفض القدرات»، ويقدم أمثلة توضح تأثيرها الفعلي على سير عمل الشركات. تُظهر البيانات أن أغلب النماذج السائدة تقع في حالة تراجع، ما يؤثر على إنتاجية الشركات واستقرارها، ويجب على الشركات البدء في إيلاء اهتمام لاستقرار النموذج بوصفه معيارًا جديدًا، وإلا فإنها ستواجه مخاطر على البنية التحتية.

ChainNewsAbmediaمنذ 19 د

تحدّث OpenAI Codex إلى وكيل ذكاء اصطناعي يتحكم في سطح المكتب، ويؤتمت سير عمل التطوير

تتطور نسخة Codex المُطوّرة من OpenAI من مساعد برمجي إلى وكيل مستقل لبيئات سطح المكتب، قادر على إدارة التطبيقات، وأتمتة سير العمل، والتكامل مع أكثر من 100 تطبيق. يعزز هذا التحول استمرارية المهام وأتمتة سير العمل، ما يعكس مشهدًا تنافسيًا في أدوات ترميز الذكاء الاصطناعي.

GateNewsمنذ 22 د

Google تدمج البحث بالذكاء الاصطناعي في Chrome، مما يتيح التصفح عبر الويب بشكل حواري

يعمل Google على تعزيز Chrome ببحث مدعوم بالذكاء الاصطناعي، مما يتيح التصفح التفاعلي والإجابات المستندة إلى السياق. كما تتضمن الوظيفة الجديدة تكاملًا عبر علامات تبويب متعددة، مما يحسن تجربة المستخدم لمختلف المهام من خلال توحيد علامات التبويب المفتوحة وتقديم معلومات مصممة خصيصًا.

GateNewsمنذ 52 د

مجموعة شينسيغاي تتخلى عن تعاونها مع OpenAI لصالح شراكة مع Reflection AI وتحوّل استراتيجية التجزئة

أوقفت مجموعة شينسيغاي شراكتها مع OpenAI، واختارت بدلًا من ذلك توسيع التعاون مع Reflection AI لتعزيز الذكاء الاصطناعي في عمليات التجزئة. تهدف هذه الخطوة إلى تبسيط الجهود ومعالجة المخاوف بشأن فعالية التجارة الإلكترونية المدعومة بالذكاء الاصطناعي.

GateNewsمنذ 1 س

OpenAI 和 Google 增加对 HWP 格式的支持,韩文(Hancom)寻求估值反弹

ChatGPT 现已支持 OpenAI 的 HWP 和 HWPX 文件格式,使韩国用户能够直接上传文档进行分析,而无需转换。这提升了本地企业的可用性,并可能在近期下跌之后推动韩文(Hancom)的股价回升。

GateNewsمنذ 1 س

Google تزيل 175.5 مليون إعلان في كوريا الجنوبية باستخدام الذكاء الاصطناعي، وتعلّق 326K حسابات المعلنين

في عام 2025، أزالت Google 175.5 مليون إعلان مخالف في كوريا الجنوبية باستخدام الذكاء الاصطناعي، وعلّقت 326,000 حساب، وواجهت غرامة $50 مليون لانتهاكات الخصوصية، ما يبرز اتجاهًا متزايدًا في تطبيق الإجراءات ودور الذكاء الاصطناعي في مكافحة احتيال الإعلانات.

GateNewsمنذ 1 س
تعليق
0/400
لا توجد تعليقات