AIをアイヌ語の継承に活用 1日かかる作業をほぼ完全に自動化、京都大学

このエントリーをはてなブックマークに追加

本研究の概要図

京都大学は10月15日、消滅危機言語に認定されているアイヌ語の音声を自動で認識し、合成する人工知能(AI)を研究・開発したと発表。河原達也 情報学研究科教授、松浦孝平 同修士課程学生、三村正人 同研究員らの研究グループによるもの。なお、本研究成果は9月9日の日本音響学会で報告し、10月12日に公表した。

北海道のアイヌ文化は多くが口頭で継承されてきたが、アイヌ語は2009年に国連教育科学文化機関(UNESCO)により「極めて深刻な」消滅危機言語に認定された。以前から口頭伝承を録音・記録する活動が実施されてきたものの、書き起こし・アーカイブ化には膨大な手間とアイヌ語の知識を必要とするため、多くが未整備のままだったという。

京都大学の研究グループは、アイヌ民族博物館と平取町立二風谷アイヌ文化博物館から提供してもらった計10名・約40時間の民話(ウエペケㇾ)の音声データを用いて、音声認識の単位・構成・学習法についてさまざまな検討を実施した。

その結果、音節(子音-母音または子音-母音-子音)を単位として用いることで、深層学習に基づくエンドツーエンド(End-to-End)モデルにより、94%の音素認識率、80%の単語認識率を実現できることを明らかにした。また、音声データのうち、1人当たり10時間以上ある話者について、同モデルにより音声合成を構築している。

アイヌ民族博物館において音声と書き起こし同期のための対応付けに同AIを活用したところ、1時間のデータに対して、人手で1日必要な作業をほぼ完全に自動化できたという。京都大学は本研究により、アイヌ語のアーカイブ構築の効率化への寄与が期待されるとする。

>>京都大学「人工知能によるアイヌ語の自動音声認識・合成に成功(AINU語AI)」