東芝、人間の音声の抑揚とテンポをまねるAI音声合成 無償提供版も

このエントリーをはてなブックマークに追加

画像は公式サイトより

東芝デジタルソリューションズ株式会社は8月17日、ゲームやコンテンツを制作するクリエーター向けに、AI(人工知能)が声の表現を自動で分析し、音声合成に抑揚とテンポの演出を与える機能を搭載した音声合成ツール「Voice Track Maker(ボイストラックメーカー)」を発売した。

「Voice Track Maker」は、テキストから音声合成を作成できるWindows PC向けのソフトウェア。複数の声の辞書を組み込み、自由でなめらかな発話を作成できる。

人の音声の抑揚とテンポの情報をその場で分析し、音声合成にまねさせて発声できる「韻律射影機能」を搭載した。これにより、従来の音声合成での感情(喜び、怒り、哀しみなど)表現機能では難しかった、さまざまな演技表現を再現することが容易になった。ゲームやコンテンツの制作など、人の声の収録を必須としない分野への活用の幅が広がることを想定しているという。

製品ラインナップとして、基本機能と声辞書3本をセットにしたPro Light、基本機能と声辞書8本をセットにしたPro、体験版(一部機能制限あり)のElementsを用意した。声辞書は人の収録音声(生声)をもとにしており、Pro Light/Proではオプションを追加できる。Pro Light/Proは商用ライセンス登録をすれば商用での利用も可能だ。

>>ニュースリリース

無料で使えるAI音声合成サービス「CoeFont STUDIO」商用利用も可

Ledge.ai編集部では「Voice Track Maker」のほか、株式会社Yellstonが提供するWeb音声合成サービス「CoeFont STUDIO(コエフォントスタジオ)」、株式会社ドワンゴのエンジニアであるヒホ(ヒロシバ)氏が提供する「VOICEVOX(ボイスボックス)」も紹介している。

気になる人はそれぞれ以下の記事をチェックしてほしい。