米Meta、文字のない口頭言語をリアルタイム翻訳する新しいAI技術を発表

このエントリーをはてなブックマークに追加

画像は、Meta AIのブログ内の動画より

アメリカのテクノロジー企業Metaの人工知能研究所であるMeta AIは現地時間の10月19日、公式ブログにて、中国福建省などで使われている、文字をもたない言語「福建語(Hokkien)」をリアルタイムに通訳できる音声翻訳AIを開発したと発表した。その翻訳速度が注目を浴びている。

書き言葉を持たない言語の翻訳

福建語は、書き言葉を持たない口頭言語で、中国福建省や台湾、東南アジアの中国人コミュニティなどで話されている。今回、Metaは、AIによりリアルタイムで英語への翻訳に成功した。

従来の翻訳AIは、書き言葉をもとに行っているが、Metaによると、現在世界で使用されている約7000言語のうち半数近くが口頭言語だという。Meta AIは翻訳AIにおいて「UST(Universal Speech Translator)プロジェクト」を推進しており、世界中のすべての言語をリアルタイムで音声から音声へと翻訳することを目指している。そんな中で、今回の翻訳技術は大きな一歩と言えるだろう。

少数派言語ならではの課題

画像は、Meta AIのブログより

今回の翻訳AI開発における課題の1つに、英語やスペイン語のようなメジャー言語に比べると、福建語はAI学習のための教師データが少ないことがあったという。今回は、英語(または福建語)の音声を中国語の標準語(マンダリン)に翻訳し、そこから福建語(または英語)へと翻訳することで、多くの人に使用されている中国語の標準語のデータを、AIの学習用データとして利用できたとのこと。

新たな翻訳のアプローチ

画像は、Meta AIのブログより

従来の技術では、音声を文字に起こしてテキストで翻訳し、音声として再合成するが、今回の福建語は書き言葉を持たないため、話し言葉から話し言葉へと翻訳する「Speech-to-unit translation(S2UT)」という方法を利用し、翻訳を行っている。

実際の翻訳

画像は、Meta AIのブログ内の動画より

Meta AIのブログに掲載された動画を見ると、男性が福建語で話し終えるとすぐに英語へと翻訳されているのがわかる。同社によると、まだまだ同時翻訳に向けての一歩でしかないという。

>>Meta AIのブログ