優秀なAI人材はどこにいる? 高精度OCRの裏側にあるベトナム開発拠点

このエントリーをはてなブックマークに追加

日常的に発生する無駄な業務をなくし、人が創造性溢れる仕事に集中できる世界を目指す。」これはAIスタートアップシナモンの掲げるビジョンです。

今回は、特に技術力が顕著で個別学習に対応しているAI OCRプロダクト「Flax Scanner」について、シナモンのBusiness Development部門のお二人にお話を伺ってきました。

笹倉 大嗣(写真左)
株式会社シナモン
Business Development General Manager

宮原 隼人(写真右)
株式会社シナモン
Business Development Manager

AI OCRは業務毎にチューニングするモデルで実用的な精度を担保する

OCRの難点は、読み取り精度が悪く実用に耐えないことや、書類のフォーマットを汎用的にカバーできていない点があげられます。書式から少しでも逸れると、対応できなくなるというのがよく耳にするOCRのハードルです。

対して、既存のOCRの難点をクリアしているのが、Flax Scannerです。

――笹倉
「Flax Scannerは既存のOCRのような汎用型ではありません。要件に応じて個別学習し、クライアントにもっとも適したAIモデルを開発・提供しています。

個社個別学習により、高精度な読み取りを実現し、現場でも実用に耐えうるOCRです。さらにはFlax Scannerにはコアエンジンがあり、そこに帳票毎・項目毎で最適なモジュールを組み合わせています。必要に応じてアルゴリズムレベルからカスタマイズして精度を上げることも可能です。」

個社個別学習とアルゴリズムレベルでの対応は、やはりその工数は凄まじく高い技術力も必要です。

――このOCRを導入するためにクライアント側は、膨大なデータを用意しなければならないのでしょうか。

――笹倉
「個社個別学習には、もちろんデータが必要ですが、少ないデータでもチューニング次第で結果は出ます。

何万、何十万規模のデータを集めて汎用的なOCRを作るよりも、個社個別にチューニングを施した方が精度が高いので、データを用意するハードルもそれほど高くはありません。」

データが足りずクライアント側が導入を断念するケースは少なくありませんが、Flax Scannerの場合は、最低限のデータからAIの導入が可能になるといいます。

手書き文字の高い認識率。多種多様なフォーマットにも柔軟に対応

――Flax Scannerの読み取り精度はどれくらいでしょうか?

――宮原
「Flax Scannerは手書き文字の認識率も99.2%、ノイズやカスレ等を含む実務データでも80%~95%と、高い精度を持っています。」

――既存のOCRでは実現できていない、Flax Scanner独自の機能はありますか?

――宮原
事前設定なしで非定型書類の読み取りができます。従来のOCRでは、帳票の項目ごとに手動で情報を定義する必要がありましたが、Flax Scannerでは必要ありません。

例えば、請求書のように各社毎にレイアウトが異なるような非定型書類から必要情報を自動的に読み取ります。」

――宮原
「学習の際に、帳票の特徴量をすべて読み取り、その中から必要な情報を抽出します。たとえば請求書の場合、請求金額や支払金額の文字横部分、数字の並びを金額として取得する処理をおこないます。

この手順で項目名の横の情報を定義していくことで、未知の帳票にある情報も抽出できるようになります。」

Flax Scannerは従来の手法ではできなかった、未知の帳票情報の読み取りを実現しています。ですので、帳票のフォーマットが多岐にわたり導入を断念せざるを得なかった企業でも利用可能ということです。

となると気になるのはその導入コストです。どのくらいの費用感なのでしょうか。

――宮原
「費用は案件によってさまざまです。過去の導入事例を参考にすると、初期の構築費用がミニマム400万円ほど。大きな案件では1億円の提案になることもあります。初期構築費用は、数百万円~数千万円と対象の帳票や業務によって幅があります。

ライセンス費用においては、従量課金制と定額制がありますが、お客様によって都度お見積もりをさせていただいております。『読み取る書類の難易度』や『読み取る書類の枚数』と『書類の項目数』によって変わります。」

ケースバイケースで個別見積になるものの、シナモンの業務毎チューニングの場合、広範囲で高精度なOCRが提供されるということですね。

従来のOCRでは実運用に耐えないとか、紙帳票の処理に多大なコストがかかっているといった方は、まずはシナモンに相談、といったところでしょうか。

このような高機能OCRを提供するには、専門のAIエンジニアが必要。シナモンのここまでレベルの高いプロダクト開発の裏側には、海外での強力な開発ネットワークがありました。

開発拠点はベトナム。50人を超える優秀なAIエンジニアを擁する強力な開発体制

――Flax Scannerを作り上げるには優秀なAI人材が多く必要かと思いますが、リソースはどのように獲得しているのでしょうか?

――笹倉
「現在日本はAI人材を獲得するのは大変難しい状況で、日本国内に400人ほどしかいないと言われています。一方で、弊社では一からディープラーニングを組めるような優秀なAI人材が約50人在籍しており、私たちの強さの源となっています。」

日本で獲得できる総数からは考えられない数のAI人材を確保しているシナモン、何か特別な人材獲得手段があるのでしょうか。

――笹倉
「じつは弊社のAI開発拠点はベトナムにあり、ディープラーニング人材を現地で採用・育成しています。ベトナムではAIに特化したインターンシップをおこなっており、その中から優秀な人材を採用しています。弊社のCTO、堀田 創がAI技術者として現地で大きな影響力を持っており、優秀な学生がインターンシップにこぞって応募してきてくれます。

さらにはベトナムは資源がそれほど豊かな国ではないので、コンピューターサイエンスや人工知能などの分野が憧れの職業なんです。

ベトナムでの強力な採用ネットワークが、私たちがディープラーニングエンジニアを多く擁する背景です。」

AI人材確保のため、海外で採用ネットワークを作り上げ、現地では雇用を生み出し、日本ではクライアントの価値に還元している。国内だけではなく国外にもプラスのインパクトを与えています。

無駄な業務が解消された未来を目指し、AIで日本のホワイトカラー業務を変える

シナモンが目指すのは、ホワイトカラーをAIが代替する世界。

日々の無駄な業務をAIが代替し、人がよりクリエイティブな仕事ができる未来を作るシナモンが手がけるAIプロダクトは多岐にわたり、自然言語に対応したチャットボットや、マッチング / レコメンデーション・エンジン、さらにはコールセンター向けや議事録自動作成、自動検知を行うAI音声認識技術など、広くカバーしています。

Flax Scanner 1つとっても、人間がやるべきではない無駄な作業が代替され、社内のデータが統合、整理されていきます。事業全体が効率化され、個々がよりクリエイティブな領域に工数を割くことができる。

無駄な業務が解消された未来を実現するために、AIを人間のワークフローに組み入れることを検討してみてはいかがでしょうか。