帳票などをスキャンすることで、文字をデジタルデータに変換する「OCR(Optical Character Recognition)」は、すでに多くの職場で利用されているのではないでしょうか。
近年注目されているのが、OCRにAIの技術を取り入れることで、より認識精度を高めた「AI OCR」です。この記事では、OCRとAI OCRの違いや導入事例、データ化後の工程まで全自動化することでさらに効果的に活用するためのRPA連携、AI OCR製品を選ぶ際のポイントなどについてご紹介します。
AI OCRとは?OCRとの違いと特徴
画像出典:pixabay
OCRとAI OCR、まずは両者の違いをみていきましょう。
OCRとは
OCRとは、紙に印刷された文字をスキャナーで読み取ることで、文字をデジタルデータに変換する技術です。「Optical Character Recognition(もしくはReader)」の頭文字をとったもので、日本語では「光学的文字認識技術」と表記されます。
スキャナーアプリやPDF編集アプリなどにもOCR機能を搭載したものは多く、オフィスでの書類のデジタル化などで広く使われています。
ただし、現状のOCRは万能ではなく、いくつかの問題点を抱えています。
手書き文字は活字に比べて文字の認識が難しく、精度は下がってしまいます。とくに日本語の場合、平仮名、カタカナ、漢字と3種類の文字が混在するため、誤認識が起こりやすくなります。
▪︎座標の設定が必要
正しく認識を行うためには、読み取り対象となる帳票などの書類のどこに文字が配置されているのかといったフォーマットを指定する必要があります。そのため、読み取り作業の開始までに時間がかかることも難点です。
▪︎定型フォーマットしか対応しない
OCRで読み取ることができるのは、あらかじめ指定したフォーマットに限られます。帳票のどこに文字が入っているかが指定されていない書類を正確に認識することは困難です。
AI OCRとは
AI OCRとは、OCRにAI技術を取り入れることで、従来のOCRがもつ問題点を解消し、認識精度を向上させたものです。
AI OCRは、以下の3つの特徴を備えています。
ディープラーニングによって、誤認識を学習することにより文字認識率を向上させることができる。また、手書き文字への対応も可能。
▪︎座標の設定は不要
文字の読み取り位置を自動抽出できるので、帳票の文字の位置や項目を事前に指定しなくても認識が可能。
▪︎フォーマットが異なる帳票に対応できる
座標の設定が不要になったことで、事前にフォーマットを指定する必要もなくなり、さまざまなフォーマットの帳票に対応できる。
AI OCRとRPAの連携で可能になること
画像出典:pixabay
現在紙の文書をデータ化するためにOCRとRPAを連携させるというニーズが高まってきています。OCRとRPAの連携についてご紹介します。
RPAとは
RPA(Robotic Process Automation=ロボティック・プロセス・オートメーション)は、定型業務をソフトウェア型のロボットによって自動化するためのシステムです。このRPAをAI OCRと連携する動きも進んでいます。
RPAでは、作業手順を「シナリオ」としてソフトウェアに記憶させることで、定型業務を自動で行えるようにします。
AI OCRとRPAの連携でデスクワークの自動化が可能
AI OCRを使うことで、手書きの帳票などの文字や印刷された文字をスムーズにデジタル化できますが、そのデータをシステムに入力する作業は人の手で行わなければなりません。
そこで、RPAをAI OCRと連携させて使用すれば、入力作業も自動化することが可能になります。
手書き帳票のデジタル化→システムへの取り込みまでのプロセスをすべて自動化することで、さらなる効率化をはかることができるのです。
RPAソリューションサービス「BizRobo!」を提供するRPAテクノロジーズの執行役員の笠井 直人氏が述べるには、以下の機能は具体的に実現可能なのだそう。
▪︎スキャンデータのノイズを除去
▪︎書いてある数字を足し算してエクセルに入力
▪︎そのエクセルファイルを特定のフォルダに格納
ただ、人間も文字の読み間違いをするように、OCRも100%の精度はありえないようです。そもそも100%は必要なのか?どの程度の精度であれば十分なのか?を考えつつ導入を考えるのが重要です。
AI OCRとRPAを連携させた活用事例
AI OCRとRPAを連携させることで、業務効率化を実現した事例をひとつご紹介します。
リコージャパン株式会社では、請求書処理作業の負荷を軽減するため、「RICOH Cloud OCR for 請求書」を導入。帳票解析技術と画像処理技術を搭載したAIが請求金額や請求日、請求元名などを自動認識して一括でデータ化。さらに、データ化した請求書情報をRPA連携することで、請求書業務の自動化を実現しました。
自動化により、請求情報の確認もれやミスがなくなったことに加え、紙の情報を扱う必要がなくなったことで、テレワークへの取り組みも検討可能になったそうです。
AI OCRの導入で注目すべきポイント
画像出典:pixabay
AI OCRを実際に導入する場合は、自社のニーズに沿ったものを見きわめることが重要となります。AI OCR製品を比較する際には、以下のポイントに注目するとよいでしょう。
最も重要なポイントは、OCRの精度でしょう。多くのOCRソフトウェアでは、認識率がパーセンテージで提示されています。また、手書き文字専用や活字専用、どちらにも対応するタイプなどに分かれるため、認識対象となる文字の種別も確認が必要です。
▪︎価格
ソフトウェア自体を購入する買い切り型の場合、購入時の費用に加えて保守費用についても確認する必要があります。なお、最近は月額/年額費用を支払って使うサブスクリプション型の製品も増えており、こちらの場合は保守・バージョンアップなどの費用が利用料に含まれているケースが一般的です。
▪︎オンプレ/クラウド
オンプレミスは、カスタマイズしやすい点や強固なセキュリティを確保できる点がメリットですが、初期費用の負担は大きくなります。一方のクラウドは、導入が比較的容易な点がメリット。初期費用の負担も小さいため、試験的に導入してみたい場合にも適しています。
▪︎RPAとの連携
RPAとの連携を考えているなら、想定したフローでの連携が可能かどうか、既存の業務をしっかり代替できるものになるかについても確認が必要です。
AI OCR製品の比較
主要なAI OCR製品を比較すると、下記のとおりになります。
製品名 | 価格 | オンプレ/ クラウド | 対象文字 | RPA連携 | 特徴 |
DX Suite | 初期費用20万円〜/月額10万円〜 | オンプレ/ クラウド | 手書き/ 活字 | 対応 | 取り込んだ書類は、自動で種類ごとに仕分けできる。 |
AI よみと〜る | 月額10万円〜 | クラウド | 手書き | 対応 | 直感的に使いやすいいブラウザベースの管理画面を採用。 |
スマートOCR | 初期費用5万円〜/月額費用3万円〜 | オンプレ/ クラウド | 手書き/ 活字 | 対応 | オンプレミスおよび4タイプのクラウドが容易されている。 |
Flax Scanner | 要問い合わせ | オンプレ/ クラウド | 手書き/ 活字 | 対応 | 業務内容や帳票に応じた独自チューニングを実施。 |
Tegaki | 要問い合わせ | クラウド | 手書き | 対応 | 99.2%の高い認識精度をもつ。業界用語にも対応。 |
LINE BRAIN OCR | サービスページ参照 | クラウド | 手書き/ 活字 | – | LINE公式アカウントとの連携もスムーズ。非定型フォーム対応。高水準の認識精度。多言語対応。 |
AI OCRを効果的に活用するには、実際に製品を使う社員への教育や、導入時のサポートといった、人に対するマネジメントも重要になります。
自社のニーズにあった製品を選び、現場の理解が得られるようにマネジメントすることで、業務効率化につながる導入ができるはずです。
AI OCRの導入事例
AI OCRの導入は、大幅な業務効率化につながることもあります。今回は、AI OCRを導入しているいくつかの事例をご紹介します。
手書き文字認識AI「Tegaki」
オーダーメイドのスーツ・シャツを扱うスタートアップ「FABRIC TOKYO」では、店舗スタッフが採寸しながら手書きで記入したメモを、手書き文字認識AI「Tegaki」を使ってデータ化。
ほぼ100%の精度で読み取ることができ、データはクラウドにアップロードするので、顧客からもいつでもアクセス可能です。スタッフがメモをExcelに入力し直してデータを作成していた頃に比べ、付き180時間の労働時間削減につながったといいます。
AI OCRプロダクト「Flax Scanner」
株式会社シナモンが開発した「Flax Scanner」は、請求書など、取引先毎にレイアウトが異なるフリーフォーマットの書類を事前設定作業なく、スキャンするだけで自動読み取みが可能なAI-OCRです。
要件に応じて個別学習し、クライアントにもっとも適したAIモデルを開発・提供しており、手書き文字の認識率も99.2%、ノイズやカスレ等を含む実務データでも80%~95%と、高い精度を持っています。
AI OCRのこれから
AI活用を検討する際、そもそも社内のデータが紙でしか管理されておらず、データ活用が進まないという状況を目にします。その場合、全ての紙データをデジタル化しシステムに取り込んではじめて、デジタルデータを活用して意味のあるアウトプットが実現できます。
これからますますAI活用の流れが大きくなっていく中で、最初の一歩としてAI-OCRでデジタルデータを十分に溜め込むことへの需要が高まっていくはずです。最近では、一部本記事でもご紹介したように、サービス化されたOCRプロダクトもたくさん登場してきています。AI OCR技術は今、ビジネス広く普及していこうとしてます。