SNSで話題 ドワンゴの100人の声に変換できるAI声変換サイトを試した

このエントリーをはてなブックマークに追加

画像は、実際にデモページで声を変換し、ダウンロードした動画をスクショしたもの

今回は、SNS上で「す、すごい」「まじでやばい」などと話題になったサービスを紹介したい。

ドワンゴが9月14日に、デモページを公開した、自分自身の声を100人の声に変換できるAIボイスチェンジャー「Seiren Voice」だ。

Seiren Voiceは、機械学習を中心とした研究開発とサービス応用を手がける「Dwango Media Village(ドワンゴメディアヴィレッジ)」が開発したもの。デモページでは、実際に自分自身の声を100人の声に変換できる(デモページ)。

わずか1分で自分の声をほかの人の声に

デモページより)

今回は、声を変換するまでの流れ(といっても、めちゃくちゃ簡単)と、実際の音声を紹介する。

1.自分の声を「録音」する

まずは、自分の声を「録音」するところから。

ページの右上にある「録音」をクリックし、変換したい言葉を喋ってみる。ただし、10秒ほど話すと、「録音エラー:音声が長すぎます」と表示された。5秒ほどに収めるのが良さそうだ。

2.さきほど話した言葉を「テキスト入力」する

次は「テキスト入力」にさきほど自分が喋った言葉を入力する。

3.変換したい「声選択」をする

いよいよ、自分の声を変換したい声を選択していく。1度に選択できる声の種類は8人までだ。

対象になる8人の声の選択手段は、前もって用意された「プリセット」、自動で8人を選んでくれる「ランダム」、100人の声から自分の好きな声を選べる「自由選択」の3つが並んでいる。

声の種類は「声の高い男性」「声の高い子ども」などの表記ではなく、「JVS010」「JVS004」というふうに表示されている。それぞれの音声の再生ボタンをクリックすると、「かすかに聞こえてくる」といった声を試聴はできるものの、100人から8人の声をチョイスできる「自由選択」は難易度が高そうだ。

ひとまず、私は前もって用意された「プリセット」を選んでみた。8人は男女のバランスはもちろん、大人から子どもまで、さまざまな声が揃っている印象だ。

4.自分の声を「声変換」をする

「声変換」をクリックすると、「予測時間:11秒 ※混雑状況によっては数分かかることもあります」というふうに変換完了までの時間が表示される。

5.「分析結果」が表示される

喋った音声をもとに「分析結果」が表示される。

6.「変換結果」から音声をダウンロードできる

最後には「変換結果」の部分に、8人の声に変換された動画が表示される。実際に音声を聞きたければ、「動画をダウンロード」をクリックしよう。

作業は以上だ。実際に変換してみればわかるが、とくにAIに関する知識などがなくても、めちゃくちゃ簡単に作業できる。私の場合は1分以内に終了した。

SNS上の「す、すごい」「まじでやばい」も納得

実際に、私の声を8人の声に変換した動画はこちらだ。最初にあるのは私の声で、その後で変換した8人の声が順に流れていく。

SNS上で「す、すごい」「まじでやばい」など、技術力の高さに驚く声があるのも納得の完成度と言える。

さすがに、身体を幼児化させる『APTX4869(アポトキシンよんはちろくきゅう)』はまだ存在しないけれど、江戸川コナンがいつも推理を披露するときに使っている「蝶ネクタイ型変声機」のような技術は、すでに現実社会で実現しつつあるのだ。

最後にいきなり『名探偵コナン』フリークぶりを発揮してしまったが、自分自身の声を100人の声に変換できるAIボイスチェンジャー「Seiren Voice」が気になった人はデモページで試してほしい!