Google Meluncurkan Gemini 3.1 Flash TTS dengan Ekspresi Emosional yang Ditingkatkan serta Kemampuan Multi-Pembicara

Pesan Gate News, 17 April — Google mengungkap Gemini 3.1 Flash TTS, model text-to-speech canggih dengan fitur ekspresi emosional dan kontrol yang ditingkatkan, pada 15 April. Model baru akan diluncurkan secara bertahap melalui API pengembang, Vertex AI untuk perusahaan, serta alat kolaborasi.

Kemampuan inti model ini mencakup tag audio berbasis bahasa alami untuk penyetelan kecepatan, intonasi, dan emosi, ditambah “Director Mode” untuk menentukan adegan dan peran karakter guna menghasilkan keluaran suara yang lebih bernuansa. Fitur multi-pembicara memungkinkan pembuatan dialog secara simultan, sehingga menghasilkan alur percakapan yang lebih natural dan cocok untuk podcast, konten audio, serta asisten AI. Model ini mendukung lebih dari 70 bahasa dan dialek, mencerminkan aksen dan ekspresi regional untuk pengalaman suara lokal di seluruh dunia.

Google menekankan performa dan efisiensi biaya, meraih skor tinggi pada tolok ukur evaluasi manusia buta (blind) sambil menurunkan biaya komputasi melalui arsitektur Flash—yang dirancang untuk adopsi skala besar di perusahaan. Audio yang dihasilkan menyertakan watermark SynthID untuk mengidentifikasi konten yang dihasilkan AI dan melawan misinformasi.

Langkah ini mencerminkan persaingan yang semakin ketat dalam antarmuka suara. OpenAI menggabungkan fitur suara real-time dengan AI percakapan untuk interaksi yang menyerupai manusia, sementara Meta memperluas investasi pada karakter AI dengan pengalaman sosial berbasis suara. Pengamat industri mencatat bahwa meskipun akting tingkat tinggi dan pekerjaan kreatif mungkin tetap digerakkan manusia untuk saat ini, pasar produksi yang berulang dan berskala besar bisa melihat adopsi AI secara bertahap dalam sektor dubbing, periklanan, dan buku audio.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Data mengungkap bahwa “Claude menjadi kurang cerdas” bukan sekadar mitos kota; model AI yang tidak stabil menjadi risiko perusahaan

Artikel membahas fenomena bahwa LLM (model bahasa besar) dalam penerapan AI perusahaan menunjukkan perilaku yang tidak stabil, yang disebut sebagai “penurunan kecerdasan”, serta memberikan contoh untuk menjelaskan dampak nyatanya terhadap alur kerja perusahaan. Data menunjukkan bahwa sebagian besar model arus utama berada dalam kondisi penurunan (degradasi), memengaruhi produktivitas dan stabilitas perusahaan; perusahaan perlu mulai memprioritaskan stabilitas model sebagai standar baru, jika tidak maka akan menghadapi risiko infrastruktur dasar.

ChainNewsAbmedia19menit yang lalu

OpenAI Memperbarui Codex Menjadi Agen AI yang Mengontrol Desktop, Mengotomatiskan Alur Kerja Pengembangan

Codex versi OpenAI yang ditingkatkan berkembang dari asisten pemrograman menjadi agen otonom untuk lingkungan desktop, yang mampu mengelola aplikasi, mengotomatiskan alur kerja, dan berintegrasi dengan lebih dari 100 aplikasi. Perubahan ini meningkatkan kesinambungan tugas dan otomatisasi alur kerja, mencerminkan lanskap kompetitif dalam alat pemrograman berbasis AI.

GateNews22menit yang lalu

Google Mengintegrasikan Pencarian AI ke dalam Chrome, Memungkinkan Penjelajahan Web Percakapan

Google sedang meningkatkan Chrome dengan pencarian berbasis AI, memungkinkan penelusuran percakapan dan respons yang peka terhadap konteks. Fitur baru ini juga menghadirkan integrasi multi-tab, meningkatkan pengalaman pengguna untuk berbagai tugas dengan mengonsolidasikan tab yang terbuka dan memberikan informasi yang disesuaikan.

GateNews52menit yang lalu

Shinsegae Group Menghentikan Kolaborasi dengan OpenAI untuk Bermitra dengan Reflection AI, Mengubah Strategi Ritel

Grup Shinsegae menghentikan kemitraannya dengan OpenAI, memilih kolaborasi yang diperluas dengan Reflection AI untuk meningkatkan AI dalam operasi ritel. Keputusan ini bertujuan untuk merampingkan upaya dan mengatasi kekhawatiran mengenai efektivitas perdagangan berbasis AI.

GateNews1jam yang lalu

OpenAI dan Google Tambah Dukungan untuk Format HWP, Hancom Berupaya Meraih Kenaikan Penilaian

ChatGPT kini mendukung format file HWP dan HWPX dari OpenAI, sehingga pengguna Korea dapat mengunggah dokumen langsung untuk dianalisis tanpa perlu konversi. Ini meningkatkan kemudahan penggunaan bagi bisnis lokal dan berpotensi mendorong pemulihan saham Hancom di tengah penurunan baru-baru ini.

GateNews1jam yang lalu

Google Menghapus 175,5 Juta Iklan di Korea Selatan dengan Penegakan Berbasis AI, Menangguhkan 326K Akun Pengiklan

Pada tahun 2025, Google menghapus 175,5 juta iklan yang melanggar di Korea Selatan dengan bantuan AI, menangguhkan 326.000 akun, dan menghadapi denda $50 juta karena pelanggaran privasi, yang menyoroti tren penegakan yang semakin meningkat serta peran AI dalam memerangi penipuan iklan.

GateNews1jam yang lalu
Komentar
0/400
Tidak ada komentar