一般人の声をAIで再現できるサービスがすごい! 葬式や冠婚葬祭で生前の声で喋ることも

このエントリーをはてなブックマークに追加

エイベックス子会社のコエステ株式会社は9月8日から、エイベックスのスタジオで収録する音源から個人の声の特徴を学習し、いつでも音声出力できる「デジタルボイス・プレミアム」を提供開始した。

デジタルボイス・プレミアムは「自分の声をさまざまな分野で広く活用したい」もしくは「病気などの理由で今の声を残しておきたい」と考える個人に向けて制作したという。

収録した音声から、その特徴を抽出した声の分身「コエ」を作成しておくことで、テキストを入力するだけで、その人の声色や喋り方を再現した合成音声をいつでも生成できる。

たとえば、忙しい経営者に代わって本人不在の場でも講演やプレゼンテーションをしたり、創業者の「コエ」で何代にもわたって従業員に新しいメッセージを届けたりできる。もし咽頭がんなどの病気や怪我で声を失っても、自身の「コエ」でリアルタイムにコミュニケーションを取り続けられる。自分自身の葬儀や大切な人の冠婚葬祭などで、生前の「コエ」でメッセージを送ることも可能だ。

AIが機械学習し、再現性の高さが特徴

デジタルボイス・プレミアムは、ユーザーがいくつかの文章を読み上げると、その音声からその人の声の特徴をAIが機械学習し、その人の「コエ」を生成するという仕組みだ。デジタルボイスさえあれば、文字を入力するだけで、誰でも「コエ」で人工的に発話させられる。

一般的には、音声合成はロボットのような無機質な機械音のイメージが大きいかもしれない。しかし、同社が提供するデジタルボイス・プレミアムは、収録音声の音色や抑揚、リズムなどの特徴を合成音声に最適に反映する技術や、統計的な学習にもとづく滑らかなパラメーターを生成するコア技術を搭載している。人間に近い自然な発話が可能で、再現性の高さが特徴という。

公式サイトより

公式サイトでは、男女それぞれの「合成音声」と「実際の声」を聞き比べられる。実際に試聴してみたところ、もちろん「100%再現できている」とは言えないものの、相当高いクオリティで再現されている印象を受けた。それこそ、家族や親しい人の葬式で故人の声がこのようなクオリティで再現されたら、私ならば涙を流してしまうだろう。気になる人は公式サイトで聞き比べてほしい。

「ホームビデオで音声が少し残っている」という悲痛の声も

今後は、SNSメッセージを送信者本人の「コエ」で送ったり、カーナビやスマートスピーカー、オーディオブックなどの音声を身近な人の「コエ」で出したり、各種サービス企業との連携実現を目指すという。たとえば、各種サービス企業との連携次第では、カーナビで「自分の好きなアイドルにナビしてもらう」ことも可能とのこと。

なお、現在の技術では、ホームビデオの少量の音声から、声の復元をすることは難しいという。コエステの担当者はこのような状況を踏まえ、「『コエステを知らずに手術をしてしまって、もう声が出せなくなってしまったのですが、ホームビデオで音声が少し残っているからどうにかしてもらえませんか』といった悲痛のメールも多くいただいます。そういう悲しい事例を少しでも減らしたく、多くの人にコエステのサービスを知っておいていただきたい」と述べる。

デジタルボイス・プレミアムの価格は50万円(税抜)と決して安くはないが、必要としている人にはきわめて重要なサービスと言えるだろう。カーナビやスマートスピーカーなど、各種サービスとの連携にも注目したい。

>>ニュースリリース

「AI美空ひばり」どこまでがAIでどこまでが人なのか

合成音声と言えば、メディアで大々的に報じられた「AI美空ひばり」を思い出す人も少なくないかもしれない。

日本科学未来館は8月23日、オンラインイベント「AIを使って、亡くなった大切な人に会いたいですか?」をニコニコ生放送で開催した。本イベントは、故人の生前の言動を再現する技術の賛否について取り扱うもの。テーマがテーマだけに、メディアで大々的に報じられた「AI美空ひばり」に関する話題が多かった。

ゲストスピーカーは東京大学 未来ビジョン研究センター 特任講師の江間有沙氏、東京大学 次世代知能科学研究センター 教授で、AIを使って故手塚治虫氏の新作マンガを作り出すプロジェクト「TEZUKA 2020」に参加する松原仁氏、東京工業大学 リベラルアーツ研究教育院 教授で、政治学者として死者との関係性や倫理観の点から技術の危うさを指摘している中島岳志氏が務める。

Ledge.aiでは、故人の生前の言動を再現できる技術に関する基礎知識はもちろん、その賛否についてもレポートしている。気になる人は以下の記事をチェックしてほしい。