凸版印刷が近代のくずし文字を読解するAI -OCRを開発

このエントリーをはてなブックマークに追加

凸版印刷株式会社は11月11日、くずし字を含む明治期から昭和初期の手書き文字をAIによって解読するAI -OCRを開発したことを発表した。同社が提供している江戸時代のくずし字を対象としたAI -OCRをもとに、近代の多様な筆跡の手書き文字に対応の範囲を拡張させたもので、2023年4月より正式サービス開始を予定している。サービス提供中のふみのはゼミシステムや、開発中の古文書解読スマホアプリで提供予定。

神戸大学・三井文庫との共同研究

近代の手書き資料は、くずし字で記されているものが多いことから、江戸時代の資料よりも解読が困難な場合もある。また現在、公文書、企業経営文書、業務日誌など多くの近代に作成されたくずし字を多く含む手書きの資料が残されている。手書きの謄本類を取り扱う業務でも、専門家にとっても読み解くのに難易度が高い資料が多い。しかし、これらの文字を解読するための実用レベルのOCR技術が開発されていなかった。そこで、凸版印刷と神戸大学経済経営研究所付属企業資料総合センター、公益財団法人三井文庫との共同研究によって、今回のAI -OCRが開発された。

難易度の高い近代手書き文字の読解

近代の手書き文字は、書き手によるくずし方のばらつきが大きい、筆記用具の多様化、カタカナ語の混在、旧字旧仮名遣い表記などの特性があり解読の難易度が高いとされている。本AIーOCRは、さまざまなパターンの文字をAIに学習させることで、これらの難読文字の解読を実現した。

>>ニュースリリース