对将先进语音功能集成到机器人中的新颖尝试——Grok的音频API刚刚亮相,支持一场机器人演示,效果相当引人注目。其技术性能不言而喻:它在行业最严格的音频推理基准Big Bench Audio中名列前茅。这一突破有望真正改变机器人领域中自主代理的可能性。语音启用的代理不仅更智能,而且更直观、更实用,适合实际部署。虽然还处于早期阶段,但基础已打牢,未来有望实现一些令人振奋的应用。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 3
  • 转发
  • 分享
评论
0/400
区块烧烤师vip
· 21小时前
grok这波audio api确实猛,直接碾压big bench audio benchmark,机器人能听懂人话了这事儿,感觉离自主agent时代又近了?
回复0
静默看客vip
· 21小时前
grok的audio api确实狠,但真正能落地用的场景还得等等看。现在全是demo炒作,实际产品化呢?
回复0
Gm_Gn_Merchantvip
· 21小时前
grok音频api真的绝了,机器人demo那效果看得出来技术确实硬。大模型往机器人方向卷,这下自主代理可能要起飞了。
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)