Google запускає Gemini 3.1 Flash TTS із покращеним емоційним вираженням і багатоголосими можливостями

Повідомлення Gate News, 17 квітня — Google представила Gemini 3.1 Flash TTS, вдосконалену модель тексту в мовлення з розширеними функціями емоційного вираження та керування, 15 квітня. Нову модель буде поступово впроваджено через API для розробників, корпоративний Vertex AI та інструменти для співпраці.

Ключові можливості моделі включають аудіотеги на основі природної мови для точного налаштування швидкості, інтонації та емоції, а також “Director Mode” для вказання сцен і ролей персонажів, щоб генерувати більш нюансовані голосові результати. Багатоголосий режим дає змогу одночасно генерувати діалоги, дозволяючи природніші сценарії розмов, що підходять для подкастів, аудіоконтенту та ШІ-асистентів. Модель підтримує понад 70 мов і діалектів, відображаючи регіональні акценти та вирази для локалізованого голосового досвіду в усьому світі.

Google наголосила на продуктивності та економічній ефективності: досягнено високих показників на сліпих бенчмарках людської оцінки, водночас зменшено обчислювальні витрати завдяки архітектурі Flash — розробленій для масштабованого корпоративного впровадження. Згенерований аудіоконтент містить водяний знак SynthID для ідентифікації контенту, створеного ШІ, та боротьби з дезінформацією.

Цей крок відображає загострення конкуренції в голосових інтерфейсах. OpenAI поєднує функції голосу в реальному часі з розмовним ШІ для взаємодії, схожої на людську, тоді як Meta розширює інвестиції в ШІ-персонажів із соціальним досвідом на основі голосу. Аналітики галузі зазначають, що хоча високорівнева акторська майстерність і творча робота можуть і надалі залишатися керованими людьми, ринки повторюваного та великомасштабного виробництва можуть поступово переходити до використання ШІ в дубляжі, рекламі та сегменті аудіокниг.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Дані викривають, що «Claude знижає рівень» — це не міський міф; нестабільність AI-моделі є ризиком для компанії

Стаття досліджує явище нестабільної роботи LLM (великі мовні моделі) в прикладному використанні AI-підприємствами, яке називають «зниженням інтелекту», і наводить приклади його реального впливу на робочі процеси компаній. Дані показують, що більшість основних моделей перебувають у стані зниження рівня, що впливає на продуктивність і стабільність підприємств; компаніям потрібно почати приділяти увагу стабільності моделей як новому стандарту, інакше вони ризикуватимуть інфраструктурою.

ChainNewsAbmedia19хв. тому

OpenAI Оновлює Codex до AI-агента, який керує робочим столом, автоматизуючи процеси розробки

Удосконалений Codex від OpenAI еволюціонує від інструмента для написання коду до автономного агента для настільних середовищ: він здатний керувати застосунками, автоматизувати робочі процеси та інтегруватися більш ніж із 100 застосунками. Цей зсув посилює безперервність виконання задач і автоматизацію робочих процесів, відображаючи конкурентний ландшафт у сфері інструментів для кодингу з використанням ШІ.

GateNews22хв. тому

Google інтегрує ШІ-пошук у Chrome, уможливлюючи розмовний веб-перегляд

Google посилює Chrome пошуком із підтримкою ШІ, що дає змогу вести розмовний перегляд і отримувати відповіді з урахуванням контексту. Нова функціональність також має інтеграцію з кількома вкладками, покращуючи користувацький досвід для різних завдань шляхом об’єднання відкритих вкладок і надання підібраної інформації.

GateNews52хв. тому

Група Shinsegae відмовляється від співпраці з OpenAI на користь партнерства з Reflection AI, змінює ритейл-стратегію

Група Shinsegae зупинила партнерство з OpenAI, обравши розширену співпрацю з Reflection AI, щоб посилити використання ШІ в ритейл-операціях. Це рішення має на меті впорядкувати зусилля та усунути занепокоєння щодо ефективності ШІ в комерції.

GateNews1год тому

OpenAI та Google додають підтримку формату HWP, Hancom прагне відновлення оцінки

ChatGPT від OpenAI тепер підтримує формати файлів HWP і HWPX, що дає змогу користувачам із Кореї завантажувати документи напряму для аналізу без конвертації. Це підвищує зручність для місцевого бізнесу та може сприяти відновленню курсу акцій Hancom на тлі недавніх спадів.

GateNews1год тому

Google видалила 175,5 млн оголошень у Південній Кореї, застосовуючи ШІ; призупинила 326 тис. рекламних акаунтів

У 2025 році Google видалила 175,5 мільйона оголошень, що порушували вимоги, у Південній Кореї за допомогою ШІ, призупинила роботу 326 000 акаунтів і зіткнулася зі штрафом у $50 мільйонів за порушення приватності, підкресливши тенденцію до посилення застосування заходів і роль ШІ в боротьбі з шахрайством в рекламі.

GateNews1год тому
Прокоментувати
0/400
Немає коментарів