【AI×特許】未開拓領域に人工知能が実装され、常識を変えていく

このエントリーをはてなブックマークに追加

新規性のある高度な技術的発明を保護する特許制度には大きな課題があります。特許に関わる全ての判断の根拠となるのは、「先行技術文献調査」の結果です。しかし、この調査は、現代の情報の多さに追いつけていないのが現状です。特許の数があまりに膨大であるのに対し、それを処理できるツールがありませんでした。

それを解決すべく、AIを用いて特許の世界に「革命」を起こしているスタートアップが「amplified.ai」です。同社は、AIに全世界の膨大な特許データを事前に解析させることで、特許調査の自動化を可能にしました。

今回は、amplified.aiが特許領域に着目した理由からプロダクト開発の苦労話までを取材しました。

情報過多、特許制度の機能不全がイノベーションの足かせになっている

――特許領域で事業を立ち上げた理由をお聞きしたいです。

――Samuel Davis
「イノベーションが起きない理由には、どんなことがあげられると思いますか?

私たちが特許にフォーカスしたのは、特許領域にある課題を解決することが、最終的にその問題の突破口の一つに繋がるからです。

300年前の産業革命時代、新しい技術を開発しても、コピーされたくないという理由でその技術を隠す傾向にありました。技術が認知され、そこに別の開発者が手を加え、またさらに新しい技術が生まれることの連続がイノベーションをもらたします。つまり、技術がクローズドな状態では、そもそもイノベーションは起こり得ません

そこで、発明者が独占権利をもらう代わりに、発明した情報を全て開示させる特許制度が生まれました。しかし、本来は開発者を守ると同時に、イノベーションを促進する役割を担う特許制度が、現代社会では情報過多によって活用されていないのが現状です。

――Samuel Davis
「たとえば、技術者が既存の開発物を改良して新たな発明をしたくても、データが多すぎて一体誰の権利を侵害する恐れがあるのかもわかりません。しかし、その調査を専門の調査会社や弁理士などに頼むと、今度は費用がかかるだけでなく、結果を得るまでに数日〜数週間も待たねばなりません。結果として、イノベーションを促進させるはずの特許制度が、逆に足かせになっているのです

amplifiedは、紙の情報のデータ化やAIによる精度の高い判断で、より簡単かつ低コストで誰もが特許調査をできるようにします」

費用面の課題に対処するために、相場より安い料金で特許調査を提供する会社もあります。しかし、そのような会社は膨大な調査対象の文献全てを調査しないため、かなりの漏れが生じているのが現実です。

これまでの特許調査は、「高価格で高品質」か「低価格で低品質」かのどちらかでした。しかし、AIがその常識を覆し、「低価格でも高品質」を可能にします。この現象は特許の領域だけでなく、さまざまな領域で起こっていることです。

膨大なデータを処理できるツールが不足

――これまで特許調査はどのように行われていたのでしょうか?

――Samuel Davis
「従来、特許調査はデータベース検索と調査員による読み込みで行われています。世界中の膨大な特許データのなかから、近い発明などを絞り込むことで、発明の新規性が判断されています。

調査は、25万種もの分類コードに分けられている既存の特許から、コードやキーワードから類似した特許を数千件まで絞り込みます。しかし、そのなかで本当に自社の発明に類似した特許は数件しかありません。

これは多くの人が知らないことですが、数件を見つけ出す調査は、人間が特許を一つ一つ読んで理解する必要があります。当然、膨大な情報をすべて考慮した判断には限界があり、類似した特許が審査に通るなど、適切な判断が下せないという課題がありました」

amplified.aiは、発明を説明する特許の文章パターンから「発明の技術概念」を抽象化する学習手法を開発し、すべての特許同士の類似性を評価します。AIにすべての特許を事前に読ませておき、人間はAIの評価を参照し微調整するというアプローチです。これは従来の調査のやり方とは全く異なります。

――Samuel Davis
「課題は、コスト面でもありました。特許調査の依頼後、まずは該当の技術領域の特許データを絞り込み、さらに細かい技術に分類します。作業は人手で行われ、専門的なスキルも要するため、数百万~数千万円の費用がかかり、期間も数週間は必要になります」

amplifiedを使うことで、世界中の膨大な特許データをスピーディーに、低コストで正確に検索できる。しかし、情報はもともと紙で管理されていたとあり、開発に相当労力がかかったことは、容易に想像できます。

未開拓領域のAI開発に伴う泥臭い苦労

――さまざまな課題があったなか、amplifiedの開発で苦労した点はなんでしょう?

――Samuel Davis
「データ自体はなんとか取得できたのですが、ディープラーニングへ適応できるレベルにデータをクレンジングするのが大変でした。データサイエンティストが数人で取り掛かっても、およそ1年間かかりましたね。

ただの検索エンジンやセマンティックサーチツールであれば、データの不備があっても動きます。しかし、弊社の開発するAIの学習能力はデータに依存するため、不備があった場合は全体の精度に影響が出てしまいます。そこで、世界97ヶ国、合計1億個もの膨大なデータを、すべて自社でクレンジングしました。

データができていても、そこからAIの精度を測ることも課題でした。マスメディアで一番よく紹介されるAIは画像認識です。言語は写真(画像)と違って、絶対的な答えは存在しません。たとえば、AIが犬の写真に対して『猫』と名付けるのは違うとはっきりわかりますが、『ウィルスをなおす方法』という文章には、医学領域、もしくはパソコン領域のどちらかである可能性もあります。特許調査の結果には、精度を測る手段がないんです。

学習データを簡単に作れないこと、そして客観的な評価ができないことが未開拓領域のAI開発における苦労でしたね」

amplified.aiが独自開発したAI特許調査システムは、2018年4月のサービスローンチから国内外の注目を集めました。わずか1年で特許保有ランキング上位の国内企業はもとより、アメリカ、ヨーロッパ、アジアの企業や法律事務所を顧客に持つまでに成長しています。しかし、まだまだ実装したい機能も沢山あり、AIの精度も今以上に高められるとDavis氏は力強く語ります。

2019年の9月に予定している新バージョンの公開に向け、ますます成長の勢いを増すamplified.ai。彼らのサービスは、特許取得にかかる時間を劇的に短縮させ、特許侵害をめぐる無駄な訴訟も減らしていくでしょう。人間の想像力を生かす新たな社会の実現に向け、amplified.aiの挑戦は続いていきます。