xAI、Grokの音声認識(Speech-to-Text)および音声合成(Text-to-Speech)APIを提供開始

Gate Newsメッセージ、4月18日 — xAIは4月17日、Grokプラットフォーム向けの音声認識 (STT) と音声合成 (TTS) のAPIの公式ローンチを発表しました。このアップデートは、高精度かつ低遅延の音声インタラクション機能を提供することを目的としており、開発者がアプリケーションに自然で流暢なボイス会話体験を統合できるようにします。

新しいAPIは、シームレスな音声ベースのインタラクションをサポートし、ユーザーが音声入力でGrokと対話し、合成されたオーディオの応答を受け取れるようにします。この拡充により、さまざまなユースケースやプラットフォームにおいて、Grok AIアシスタントのアクセシビリティとユーザー体験が向上します。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

OpenAIの幹部ビル・ピーブルズ氏とケビン・ウェイル氏、リーダーシップの組み替えで退任

OpenAIの幹部であるビル・ピーブルズ氏とケビン・ウェイル氏が退任を発表し、同社が業務を分散化する一連のリーダーシップ変更の一環となった。両氏の退任は、ほかにもいくつかの注目度の高い退任に続き、同社の組織体制の変更を伴っている。

GateNews31分前

ZoomがWorldと提携し、顔認識でディープフェイク検出を追加

Zoomは、ビデオ通話中に実在の参加者をAIディープフェイクと見分ける機能を立ち上げるため、Sam AltmanのWorldと提携しました。これは、ホストと参加者向けの検証オプションを用意することで、増加するディープフェイク詐欺への対抗を目的としています。

GateNews41分前

AI生成のバグ報告がcURLの保守チームを圧倒

AIが生成したバグ報告がcURLプロジェクトに殺到しており、投稿件数の大幅な増加によりリソースが逼迫しています。管理者たちは、AIモデルへのアクセスを制限し、流入への対応のため脆弱性報奨プログラムを停止することで対処しています。

GateNews1時間前

Cursorは$2B で$50B の評価を主導し、Thrive Capitalがリード

AIコーディングのスタートアップであるCursorは、Thrive CapitalとAndreessen Horowitzが主導し、少なくとも$2 billionを$50 billionのバリュエーションで調達する予定だ。同社は2026年までに$6 billion超の売上を目指しており、段階制の料金モデルとSOC 2 Type 2の認証によって差別化している。

CryptoFrontier1時間前

Iconiqの資産運用会社、新たなAIファンドのために数十億ドル規模の資金調達を準備

サンフランシスコ拠点の資産運用会社Iconiqは、AI投資に焦点を当てた新ファンドの調達を計画している。同社はこれまでに2025年にAIスタートアップへ$3 billion超を投資してきた。 同社の投資家基盤は、より多くの機関投資家を含む形へと変化しており、最近6件の新たなAI投資を行った。

GateNews1時間前

アンソトロピック、15億ドルの著作権和解で約12万件の著者の請求を受領

約12万人の著者が、AIトレーニングにおける無断の書籍利用をめぐるアンソトロピック(Anthropic)の15億ドルの和解金の取り分を主張しています。この和解は著作権侵害に起因しており、AI業界における公正な競争への懸念を引き起こしています。

GateNews2時間前
コメント
0/400
コメントなし