東芝、異常検知AIで79.1%の精度を達成 正常データで学習する新手法で

このエントリーをはてなブックマークに追加

株式会社東芝は12月14日、製造現場における製品の外観画像を用いた異常検知AI(人工知能)の開発において、公開データでの検知精度を従来技術の69.5%から79.1%と約10ポイント向上し、世界トップレベルとうたう検知性能を達成したと発表。社内の半導体製造工場で収集した検査画像に対しても、50.5%から91.6%へと検知性能を改善したという。

本AIは、独自の深層学習手法を用いることで、製造現場では収集が困難な異常データを使用せずに、正常データのみから高い精度で学習。検査対象の外観が撮影した部位や製品の種類によって異なる場合でも、高精度に異常を検知するという。本AIにより、従来、目視で実施していた半導体ウェハの品質検査などの自動化が期待でき、製造現場における生産性の向上に貢献するとしている。

異常の発生が少なく、正常データから学習する必要がある

製造現場における製品の外観画像を用いた異常検知においては、そもそも製品の異常の発生頻度が低く、異常データの収集が困難であるため、正常データのみから学習する手法が求められる。

異常データを必要としない手法の1つとして、基準となる正常データとの差分を検知するものがある。本手法は、ボルトやナットのように部品を固定の画角・構図で撮影できる場合には有効だが、上図のような検査対象の外観が撮影した部位や製品の種類で異なる場合は、基準となる正常データを準備できず、適用が困難になる。

たとえば、半導体ウェハの欠陥検査ではウェハ上の複数個所を撮影し、拡大画像から欠陥となる塵(ちり)や傷の有無を確認する。撮影箇所の外観は撮影した部位や製品の種類によって異なり、塵や傷の形状も多種多様であることから、1つの見本(正解)に対する正誤で欠陥の有無が判定できないといった現状がある。

一方で、このような状況に対応する深層学習を用いた技術として、正常データのみから「正常データらしさ」を学習するAIを使用する手法がある。本手法では、画像データから画像の特徴を潜在変数に数値化(符号化)し、再度画像データに復元する。正常データのみを用いて学習したAIでは、異常データは正しく復元できない。

そのため、入力時と復元時の画像データの差から、撮影した部位や製品の種類によって状況が異なる場合でも、異常検知につなげられるという。ところが、類似した画像同士を誤った潜在変数に対応づけて学習してしまうことがあり、正常データを正確に復元できず、検知精度が十分ではないとのこと。

部位や製品の種類で状況が異なる場合でも異常を検知

東芝はこのような状況を踏まえ、正常な画像データの復元性能を大幅に改善する独自の「dual-encoder BiGAN手法」を用いた深層学習AIを開発したとしている。

本AIは、潜在変数から復元された画像データを再度潜在変数に数値化(再符号化)し、2つの潜在変数が一致するような制約を課して学習する。

入力時と復元時の画像データを比較することで、厳密にするといった従来の手法に加え、潜在変数の比較も実施。撮影した部位や製品の種類によって状況が異なる場合でも、より高い精度で画像を復元し、高精度に異常を検知できるとする。

今後、さまざまな検査工程・製品にも適用し、性能実証を実施するとのこと。

>>ニュースリリース

東芝、数日かかっていた精査時間をAIでわずか1日に短縮 専門家は「『これは上手い!』と思った」

東芝はAIを活用し、さまざまな業務効率化ができるサービスに取り組んでいる。

最近でも、東芝と大学共同利用機関 法人 情報・システム研究機構 統計数理研究所は12月10日、半導体工場など製造現場の不良原因解析AI(人工知能)において、現場技術者の知見の反映を可能にすることなどで、従来数日かかっていた解析結果の精査時間をわずか1日に短縮できるAI「Transfer Least absolute shrinkage and selection operator(Transfer Lasso)」を共同開発したと発表。

大学共同利用機関法人 情報・システム研究機構 統計数理研究所 教授 藤澤洋徳氏は、本AIに関するアイデアを最初に聞いたときを振り返り、「今でもありありと思い出せるのですが、『あ。これは上手い!』と思いました。これは絶対に役に立つし、汎用性が高いです」と語っている。

そのほか、詳細は以下の記事をチェックしてほしい。