東芝、画像を1枚登録するだけで新しい物体を検出する画像認識AI「Few-shot物体検出AI」を開発

このエントリーをはてなブックマークに追加

株式会社東芝は5月25日、製造現場や流通現場で取り扱う製品や部品の変更が発生しても、新規物体の画像を1枚登録するだけですぐに検出する画像認識AI「Few-shot物体検出AI」を開発したと発表した。

本AIは、新製品や改良品等で扱う製品や部品が定期的に変更になる工場や、常に新規商品への対応が求められる物流現場など、頻繁に新しい物体が登場する現場での活用が期待される。

画像から人や物体を検出する画像認識AIは、生産性の改善や自動化・省力化のための解析に基盤的に使われる重要な技術だ。

人の行動や周辺環境の認識に必要不可欠な技術として、製造現場における品質・生産性向上、社会インフラの現場における保守点検作業の効率化、物流・流通現場における業務効率化など、多種多様な分野で実利用が進んでいる。

東芝グループでも、インフラサービスを支える技術として画像認識AIの活用が進んでいるが、実際の現場では、AI導入時には存在しなかった新しい物体が登場する場面が多くある。

たとえば、長期間運用中に新規の部品や製品を扱う場合や、別の製品や部品を扱う新設工場に適応する場合、AIが未学習の物体を新たに追加し解析対象とすることが求められる。

新規物体の検出には、通常、AIの再学習を行なう(以下、再学習型)が、現場で大量の画像・映像と正解情報を用意する必要があることに加え、学習時間が長くかかるため、頻繁に新規物体が登場するような現場での活用は困難だった。

一方で、再学習が不要な方式(以下、登録型)を採用すると、実用化レベルの検出精度が実現できない課題があった。

そこで、未学習の物体の画像を1枚用意し登録するだけで、AIの再学習をすることなく、すぐに新規物体の検出を可能にする「Few-shot物体検出AI」を開発した。

通常AIは、対象となる「正解」が付与された物体以外は背景として扱い、画像から対象物体が映る領域を物体候補として抽出する深層モデルを学習するが、今回は、付与された「正解」以外の、背景として扱っていた物体を含めて自動的に学習する新たな方式。
従来の再学習型との学習の違い

さらに、開発した方式で事前に学習した深層モデルを用いることで、従来であれば背景と認識していた部分から自動で抽出される物体候補と、登録した新規物体とを比較し、画像から新規物体を検出する「Few-shot物体検出AI」を確立した。
「Few-shot物体検出AI」による物体検出

本AIを用いることで、新たに検出したい対象の画像1枚を登録するだけで、すぐに検出可能になる。
従来の登録型との認識精度の違いの例

深層モデルの再学習を必要としない登録型の従来方式の検出精度21.2%と比較して、東芝方式では検出精度が46.0%へと大幅に向上した。

>>ニュースリリース