AIで古典のくずし字を現代の文字に1枚あたり数秒で変換する無料アプリ、開発者はタイ出身の研究者

このエントリーをはてなブックマークに追加

画像は「4分でわかる「みを」アプリの使い方」より

ROIS-DS人文学オープンデータ共同利用センター(Center for Open Data in the Humanities / CODH)は8月30日、AI(人工知能)が古典文学のくずし字を現代の文字に変換するアプリ「みを(miwo)」を正式にリリースした。対応OSはiOSAndroid。料金は無料。

「4分でわかる「みを」アプリの使い方」より

CODHは、画像に含まれるくずし字を現代の文字に変換する(翻刻する)機能を備えたAIくずし字認識技術を開発した。「みを」は本技術を誰でも気軽に使えることを目指して手がけた。スマホやタブレットのカメラでくずし字資料を撮影し、ボタンを押すだけで、AIが1枚あたり数秒でくずし字を現代の文字に変換してくれる。

「みを」は『源氏物語』第14帖「みをつくし」にちなんだ名前である。「みをつくし」が人々の水先案内となるように、「みを」がくずし字資料の海を旅する案内となることを目指すという。

1枚あたり数秒でくずし字を翻刻してくれる

くずし字がきちんと読める人は数千人程度(人口の0.01%程度)と言われる。「みを」の利用者は初学者や一般のくずし字が読めない日本人に加え、くずし字が読める上級者や専門家も想定している。それぞれに利点があるように、「みを」には以下のような機能を追加した。

「4分でわかる「みを」アプリの使い方」より

初学者向けにはくずし字学習を手助けするため、AIの認識結果に対応する元画像の領域を切り抜き、認識結果と字形が比較できるようにした。文字の領域を示す四角形を画像に重ねて表示することで、続けて書かれるくずし字(連綿体)の切れ目がわかる。CODHのくずし字データセットと連携し、認識結果に疑問を抱いたときにはくずし字の用例も確認できる。

「4分でわかる「みを」アプリの使い方」より

上級者や専門家向けには資料調査の現場での利用を想定し、AIによる認識結果の修正機能や保存機能、テキスト出力機能なども搭載した。テキスト出力結果をコピーし、ほかのアプリにもデータを持ち出せる。

CODHはそれぞれの利点について、初学者などについては「初学者、あるいは一般のくずし字が読めない日本人にとっては、文書にどんな文字が書いてあるかがわかるだけでも、内容が推測できるようになるという利点があります。この場合、そもそも人間の認識精度があまり高くないため、AIの精度は人間の精度を上回ることが多いと言えます。したがって、このタイプのユーザにとって、『みを』は役に立つアプリとなるはずです」とコメント。

専門家などについては「くずし字が読める上級者や専門家にとっては、AIの精度は人間の精度に達しないことも多いため、アプリだけで何か新しいことがわかるわけではありません。しかし資料調査の現場においては、短い時間で多くの資料の内容を把握するために、スピードが重視される場合があります。いくらくずし字が読めるとはいっても、アプリがくずし字を現代の文字に変換してくれた方が、やはり読みやすくなることは確かです。したがって、1枚あたり数秒でくずし字を翻刻してくれる『みを』は、こうした現場でも役に立つはずです」と述べている。

開発者はタイ出身のカラーヌワット・タリンさん

より多くの人々にアプリを届けるためには、AndroidとiOSという二大プラットフォームにいかに対応するかが重要な課題になる。両者は開発言語や開発環境が異なるため、大手企業などでは同一機能を備えた2つのアプリを並行して開発する場合もあるが、「みを」を手がけたのは開発者や共同開発者、共同研究者、アートディレクションをあわせて6名の少人数のチームだ。

本チームはGoogleが推進する「Flutter」を活用したクロスプラットフォーム開発により、このような問題を解決した。Flutterは単一のソースコードからAndroidとiOSに対応したアプリが作成できるため、これによりAndroidとiOSのスマホやタブレットに幅広く対応可能になった。

AIくずし字認識はCODHが開発したくずし字認識モデル「KuroNet」、およびKaggleくずし字認識コンペで1位となったtascj氏が開発したくずし字認識モデルを用いた。これらのAIモデルの学習には、国文学研究資料館が作成し、CODHが公開する日本古典籍くずし字データセットを活用している。

ただし、「みを」は江戸時代の版本から集めたくずし字データを学習しているため、江戸時代の版本に対する精度が比較的高いが、ほかの時代の資料や写本、古文書などでは精度が低下する可能性がある。シミや虫食い、紙の柄などの資料状態あるいは、照明や影などの撮影環境により精度が低下することもある。また、石碑や看板などに書かれたくずし字は現在のところ認識できない。

なお、本アプリの開発者はタイ出身で『源氏物語』古注釈が専門ながら、機械学習、とくにディープラーニング(深層学習)によるくずし字認識を研究しているカラーヌワット・タリンさん。Ledge.ai編集部ではタリンさんにインタビュー取材を実施しており、近日中に記事を公開予定である。

「みを」が気になる人はiOS版Android版をダウンロードして試してみては。

>>ニュースリリース