Google 推出 Gemini 3.1 Flash TTS,強化情感表達並支援多說話人能力

Gate News 訊息,4 月 17 日——Google 於 4 月 15 日揭曉 Gemini 3.1 Flash TTS,這是一款先進的文字轉語音模型,強化了情感表達與控制功能。新模型將透過開發者 API、企業 Vertex AI,以及協作工具逐步推出。

模型的核心能力包括基於自然語言的音訊標籤,以便針對速度、語調與情感進行微調,並提供「Director Mode」用於指定場景與角色定位,以生成更細緻的語音輸出。多說話人功能可讓對話同時生成,使對話流程更自然,適用於播客、音訊內容與 AI 助理。模型支援超過 70 種語言與方言,反映不同地區的口音與表達方式,以在全球範圍提供在地化的語音體驗。

Google 強調效能與成本效率,透過 Flash 架構在盲測的人類評估基準上取得高分,同時降低運算成本——該架構旨在支援大規模的企業採用。生成的音訊包含 SynthID 水印,用於辨識由 AI 生成的內容並打擊錯誤資訊。

此舉反映語音介面競爭的加劇。OpenAI 正將即時語音功能與對話式 AI 結合,以實現類人互動;而 Meta 則擴大投資 AI 角色,並以語音為基礎的社交體驗來推動。產業觀察人士指出,儘管高水準的表演與創意工作或許仍將以人類主導為主,但重複性且規模化的製作市場,可能會在配音、廣告與有聲讀物等領域逐步導入 AI。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Naver 和 Kakao 預計在 AI 投資持續下公布亮眼的 2026 年第一季業績

Naver 和 Kakao 預計將在 2026 年第一季公布亮眼的財報表現,主要受益於商務與廣告成長,儘管早期階段的 AI 產品影響有限。兩家公司都在顯著增加 AI 基礎設施投資,並調整策略,將 AI 整合到既有服務中。

GateNews31分鐘前

Anthropic 發布 Claude Opus 4.7,但削弱了資安能力

Anthropic 於 4 月 16 日 (當地時間) 發布其旗艦模型升級版 Claude Opus 4.7。相較於先前的 Opus 4.6 模型,Opus 4.7 展示出其在進階軟體工程能力方面的「顯著改進」,特別是在困難任務上,並在複雜、長時間運行的操作中提升了嚴謹度與一致性,同時也強化了視覺能力。然而,Anthropic 在訓練期間刻意削弱了模型的資安攻防能力,並引入安全機制以自動偵測並阻擋被禁止或高風險的請求。 ## 性能與基準 在基準測試中,Opus 4.7 的成績整體上普遍高於先前的 Opus 4.6 以及競爭對手 GPT-5.4。不過,Anthropic 強調,Opus 4.7 的整體能力仍無法與該公司最強大的模型 Claude Mythos Preview 相提並論。根據 Anthropic:『透過在真實世界部署並運作這些保護機制,我們將累積經驗,最終使 Mythos 等級模型能夠更廣泛地推出。』 ## 部署與定價 Opus 4.7 現已在所有 Claude 產品與 API 介面上線,並整合 Amazon Bedrock、Google Cloud Vertex AI 以及 Microsoft Foundry 服務。定價與 Opus 4.6 保持一致: 每百萬輸入 tokens、 每百萬輸出 tokens。 ## Token 消耗變更 相較於 Opus 4.6,Opus 4.7 的兩項變更將影響 token 用量。首先,Opus 4.7 使用更新的 tokenizer,改善模型處理文字的方式。然而,這意味著相同的輸入可能會消耗更多 tokens——大約是先前生成消耗的 1 到 1.35 倍。 第二,Opus 4.7 在較高的「思考強度」下會進行更多推理,尤其是在 agentic 情境的後續回合。這提高了對複雜問題的可靠性,但也會產生額外的輸出 tokens。 ![Token consumption increase visualization]https://img-cdn.gateio.im/social/moments-723d799b0a-f046518132-8b7abd-badf29 *Opus 4.7 token 消耗增加。來源:Anthropic* ## 市場分析與脈絡 分析師將 Opus 4.7 描述為一種「過渡」模型。投資分析師 Adam Button 指出,Opus 4.7 的釋出鞏固了 Anthropic 關於像 Mythos 這樣的「神級模型」的敘事,並驗證了市場的懷疑:公開可用且付費的模型本質上是被安全機制約束的「lite」版本。 ## 公司背景與財務里程碑 Anthropic 由 2021 年的前 OpenAI 員工創立,開發 Claude 系列大型語言模型。4 月 6 日,Anthropic 宣布其年化營收 ARR 超過 十億,這是相較於 2025 年年底 十億 的大幅增長。公司正積極追求首次公開募股。 ## 資安風險疑慮 Anthropic 高層曾多次警告 AI 對資安的影響。根據 4 月 10 日 當地時間 的報導,美國財政部長耶倫與聯準會主席鮑威爾在 4 月 7 日與華爾街領導人舉行緊急會議,討論 Anthropic 最新的 Mythos AI 模型可能如何提高資安風險。Anthropic 已表示 Mythos 不適合公開釋出,因為該模型可能被網路犯罪分子與間諜濫用。該公司正有選擇地向領先的全球資安與軟體企業提供 Mythos 的存取權。

Crypto Frontier37分鐘前

xAI 將為 Cursor 提供龐大 GPU 算力,用於 AI 程式碼模型訓練

Elon Musk 的 xAI 將提供算力給程式啟動公司 Cursor,使用數千台 GPU 來訓練其新的程式碼模型。此舉強化 xAI 在運算服務中的角色,可能提高收入並在持續虧損的情況下,解決營運成本問題。

GateNews38分鐘前

Anthropic 攜手 TrendAI 將 Claude 模型整合至企業 AI 安全平台

TrendAI 與 Anthropic 合作,將 Claude 模型整合到其平台中,以強化威脅研究與 AI 安全作業。此合作旨在在進入量產前識別漏洞,展現產業正轉向 AI 安全的趨勢。

GateNews1小時前

OpenAI 同意在未來三年支付超過 $20 Billion 購買 Cerebras 晶片,並取得股權

OpenAI 已同意在未來三年內向 Cerebras 採購超過 $20 billion 的 AI 晶片,並取得該公司的股權,目標是在其擴展 AI 服務的同時降低運算成本。

GateNews1小時前

英國AI部長批評OpenAI暫停Stargate資料中心計畫

英國的AI部長批評OpenAI決定暫停其英國資料中心計畫,並將其歸因於融資問題而非能源價格。微軟預計在另一個地點租用產能,這將影響英國的AI投資目標。

GateNews1小時前
留言
0/400
暫無留言