株式会社モルフォAIソリューションズは5月9日、国立国会図書館から「令和4年度視覚障害者等用データ作成のためのOCR研究開発(以下、本事業)」の委託事業を受託したことを発表した。
国立国会図書館は「ビジョン2021-2025 国立国会図書館のデジタルシフト」の一環として、将来にわたるすべての利用者に多様な情報資源を提供するユニバーサルアクセスを実現する事業と、そのための恒久的なインフラとなる国のデジタル情報基盤の拡充を図る事業に取り組んでいる。
2019年6月21日、視覚障害者等の読書環境の整備の推進に関する法律(以下、読書バリアフリー法)が衆議院本会議で可決、成立し、1週間後の6月28日に公布、施行された。同社は本事業を通じて、読書バリアフリー法の目的である「視覚障害者等の読書環境の整備を総合的かつ計画的に推進し、もって障害の有無にかかわらず全ての国民が等しく読書を通じて文字・活字文化の恵沢を享受することができる社会の実現に寄与すること」に取り組んでいく。
本事業では、2021年度に国立国会図書館が開発したOCR処理プログラムに機能を追加し、性能も改善する。具体的には、複雑なテキスト検索用途のみならず、視覚障がい者用の読み上げ用途にも活用できるテキスト生成を実現する。
本事業における開発機能として、読み上げ順序の調整機能とレイアウト認識機能の改善、漢字の読み情報の自動付与機能の3つが挙げられる。
読み上げ順序の調整機能では、見出しや図版を含む複雑なレイアウトイメージから本文の位置を判定し、読み上げの順序を判定する。
レイアウト認識機能の改善では、本文行の脱落や画像に近い本文の一部をキャプションとしてしまう誤認識、縦行横行の混同などを改善する。
漢字の読み情報の自動付与機能では、本文中の漢字に自動で読みがなを振り、読書のバリアフリー化を進めている。
今回の機能改善で複雑なレイアウトや白抜き・色付き文字にも対応したことで、雑誌などの読み取りも可能になったという。
>>ニュースリリース