特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
1~13 / 2838件
xAIは2026年4月23日、フラッグシップ音声モデル「Grok Voice Think Fast 1.0」を[発表]{target=“_blank”}した。同モデルは、顧客サポートや電話販売、企業向けアプリケーションなど、複雑であいまいな多段階ワークフローに対応する音声AIモデルとして位置付けられている。 xAIは公式Xでも、同モデルについて「複雑なマルチステップ業務向けに構築された最先端の音声モデル」と説明している。 ![Grok Voice Think Fast 1-0.jpg] :::small 画像の出典:[xAI]{target=“_blank”} ::: ## 現実の電話環境を想定、25以上の言語に対応 Grok Voice Think Fast 1.0は、Starlinkなどのパートナーとの協力を通じて開発された。xAIによると、同モデルは高い知能、低い応答遅延、自然な会話能力を組み合わせることを目指している。 同社は、Grok Voice Think Fast 1.0について、電話音声、背景ノイズ、強いアクセント、頻繁な割り込みといった現実の利用環境でテストされていると説明している。25以上の言語をネイティブにサポートしており、グローバル展開にも適しているという。 また、同モデルは顧客情報の聞き取りや確認にも対応する。メールアドレス、住所、電話番号、氏名、アカウント番号などの構造化データを、話し言葉から収集し、必要に応じて読み上げ確認できるとしている。 ## 推論を裏側で実行、応答遅延を増やさず会話を継続 xAIは、Grok Voice Think Fast 1.0の特徴として「リアルタイム推論」を挙げている。同モデルは、難しい問い合わせやワークフローを処理する際、応答遅延に影響を与えず、裏側で推論を進めるという。 これにより、音声対話としての自然さを保ちながら、複雑な問い合わせにも対応できるとしている。xAIは例として、「1年の月名のうち、Xの文字を含むものはどれか」という質問に対し、他モデルが誤答するケースと比較し、Grok Voice Think Fast 1.0が正しく「該当する月はない」と回答する例を示している。 ![harder to fool.jpg] :::small 画像の出典:[xAI]{target=“_blank”} ::: xAIは、業務向け音声モデルの評価指標「τ-voice Leaderboard」において、Grok Voice Think Fast 1.0が67.3%を記録し、Gemini 3.1 Flash Liveの43.8%、Grok Voice Fast 1.0の38.3%、GPT Realtime 1.5の35.3%を上回ったとしている。小売、航空、通信の各領域別評価でも、Grok Voice Think Fast 1.0が最も高いスコアを示したという。 ![voice leaderboard-grok voice.jpg] :::small 画像の出典:[xAI]{target=“_blank”} ::: ## Starlinkの電話販売・顧客対応で活用 xAIによると、Grok VoiceはStarlinkの電話販売およびカスタマーサポートでも利用されている。電話番号「+1 (888) GO STARLINK」を通じた問い合わせ対応に使われ、販売、サポート、多言語対応、新規顧客のオンボーディングなどを担っているという。同社は、Starlinkでの活用実績として、販売問い合わせの20%で、顧客が通話中にStarlinkサービスを購入していると説明している。また、カスタマーサポート問い合わせの70%を、人間を介さずGrok Voiceエージェントが自律的に解決しているという。 この単一のエージェントは、サポートと販売にまたがる数百種類のワークフローで、28種類のツールを使用する。xAIは、Grok Voiceがハードウェアのトラブルシューティング、機器交換、サービスクレジット付与など、正確性が重要な判断も担っているとしている。 ## 音声AIを業務実行型エージェントへ Grok Voice Think Fast 1.0は、単なる音声会話モデルではなく、電話業務の中で情報を聞き取り、確認し、ツールを呼び出しながら処理を進める音声エージェントとして設計されている。 生成AIの活用領域は、テキストチャットからリアルタイム音声対話、さらに顧客対応や販売などの業務実行へ広がっている。xAIの今回の発表は、Grokを会話型AIとしてだけでなく、企業の電話業務に組み込む動きといえる。 :::box [関連記事:オトナの会話もOKに xAIの対話型AI「Grok 3」、音声モードで解禁 ただし有料会員のみ] ::: :::box [関連記事:Google、リアルタイム音声AI「Gemini 3.1 Flash Live」発表 Searchの「Search Live」と連携しグローバル展開、日本版も公開] ::: :::box [関連記事:OpenAI、Realtime APIを正式公開──本番運用の音声エージェント開発を支援] ::: :::box [関連記事:三井住友銀行、生成AIの音声対応「SMBC AIオペレーター」開始──Olive一般照会を24時間365日で] ::: :::box [関連記事:「担当者に替わって!」AI自動音声エージェントが顧客離れを招くリスク] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ