Nanonetsは、機械学習をブラウザ上で簡単にできるサービスです。今回はNanonetsで、請求書の光学文字認識(OCR)をするモデルをノーコードで作成します。
Nanonetsにログインすると、この画面からモデルを選べます。今回は自分でモデルを作るので「CREATE YOUR OWN OCR Model」を選択します。
事前に10個の請求書をPDFで作成しておき、アップロードします。
次にラベルを作成します。今回は「件名」「摘要」「数量」「消費税」「合計金額」として、「START TRAINING」をクリックします。
このように、10個のファイルに対して、どの部分がそれぞれのラベルに対応するかを設定し、「TRAIN MODEL」を選択します。
モデルの学習が終了すると、グラフが表示されます。
ここで、左の欄から「My Models」を選択すると、作成したモデルが表示されるので、クリックします。
テスト用のファイルをアップロードします。
アップロードしたファイルを選択すると、このように自動で各ラベルに該当する数値が抽出されます。
最後に
今回はNanonetsを使い、OCRのモデルを作成しました。結果をExcelなどのファイルとしてダウンロードすることもできるので、うまく使えば、業務の効率化にもつながると思います。ぜひ試してみてください。