AIでデータ入力を自動化 NanonetsでOCRモデルを作成してみた

このエントリーをはてなブックマークに追加


Nanonetsは、機械学習をブラウザ上で簡単にできるサービスです。今回はNanonetsで、請求書の光学文字認識(OCR)をするモデルをノーコードで作成します。

Nanonetsにログインすると、この画面からモデルを選べます。今回は自分でモデルを作るので「CREATE YOUR OWN OCR Model」を選択します。

事前に10個の請求書をPDFで作成しておき、アップロードします。

次にラベルを作成します。今回は「件名」「摘要」「数量」「消費税」「合計金額」として、「START TRAINING」をクリックします。

このように、10個のファイルに対して、どの部分がそれぞれのラベルに対応するかを設定し、「TRAIN MODEL」を選択します。

モデルの学習が終了すると、グラフが表示されます。

ここで、左の欄から「My Models」を選択すると、作成したモデルが表示されるので、クリックします。

テスト用のファイルをアップロードします。

アップロードしたファイルを選択すると、このように自動で各ラベルに該当する数値が抽出されます。

最後に

今回はNanonetsを使い、OCRのモデルを作成しました。結果をExcelなどのファイルとしてダウンロードすることもできるので、うまく使えば、業務の効率化にもつながると思います。ぜひ試してみてください。