對於將先進語音功能整合到機器人中的新穎方法——Grok的音頻API剛剛亮相,並用於機器人演示,結果相當令人興奮。技術性能不言而喻:它超越了Big Bench Audio,這是業界最嚴格的音頻推理任務基準。這種突破有望真正改變自主代理在機器人領域的可能性。語音啟用的代理不僅更智能;它們在實際應用中也更直觀、更實用。仍處於早期階段,但為未來一些令人振奮的應用奠定了堅實的基礎。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 3
  • 轉發
  • 分享
留言
0/400
区块烧烤师vip
· 18小時前
grok這波audio API確實猛,直接碾壓big bench audio benchmark,機器人能聽懂人話了這事兒,感覺離自主agent時代又近了?
查看原文回復0
静默看客vip
· 18小時前
grok的audio API確實厲害,但真正能落地用的場景還得等等看。現在全是demo炒作,實際產品化呢?
查看原文回復0
Gm_Gn_Merchantvip
· 18小時前
grok音頻API真的絕了,機器人demo那效果看得出來技術確實硬。大模型往機器人方向卷,這下自主代理可能要起飛了。
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)