日本電気株式会社(NEC)は5月30日、国立研究開発法人 理化学研究所(理研)と共同で、AIを活用した画像認識において、新たな対象物を追加登録する際に必要となる学習データの作成作業を大幅に簡素化する技術を開発したと発表した。
近年、建設現場や工場における作業や状況の見える化など、さまざまな用途において画像認識技術の活用が広がっている。しかし、画像認識を新たな建設現場や工場に展開するためには、工具・材料・重機など新たな検知対象を継続的に登録することが必要となる。
このような場合、従来は新たな検知対象だけでなく、既存の検知対象についても、AIに対象物の位置とそれが何であるかの情報を教える必要があるため、学習データの作成が利用者の大きな負担となっていた。
本技術は、AIの学習に曖昧な情報を活用できる「弱ラベル学習」という技術を発展させることで、AIを活用した画像認識に対象物を追加登録するときに問題となる学習データの手間を削減するものだ。
弱ラベル学習は、「学習が不安定になり精度が低下する」という問題があったが、今回NECと理研は、弱ラベル学習の安定化と正しいモデルの学習の両方を同時に満たすアルゴリズムを開発した。
なお本技術を活用すると、80種類の検知対象物を含む画像認識において、学習データ作成時間を75%削減できることを確認している。
「弱ラベル学習」を安定化するアルゴリズムを開発
新たな検知対象としてバイクを追加する場合の仕組み
AI画像認識において対象物を追加登録する場合、新たな検知対象のみをラベル付けしたデータでモデルの学習ができれば、作業に必要となる時間を大幅に削減できる。
「弱ラベル学習」は、AI画像認識の学習データにおいて、一部のみがラベル付けされ、それ以外の領域は曖昧な「弱ラベル」が付与されたデータである、とみなして学習する手法である。
たとえば、トラックやバスなどの車両を認識するAIに新たに「バイク」を学習させる場合、トラックやバスや背景に対してラベル付けしないことは、それらが「バイクではない」という弱ラベルを付与したことになる。
弱ラベル学習の手法により、このように「バイク」のみをラベル付けしたデータからでも学習可能となり、データ作成の作業工数を大幅に削減できるという。
従来技術との比較
完全なラベルが付与されたデータを用いてモデルを学習する場合には、出力値が正解データに近づくようにモデルを最適化する。
これに対して、弱ラベル学習では、弱ラベルに基づいてモデルの予測の正しさを逐次推定しながらモデルを最適化するが、ラベルの曖昧性に起因して学習が不安定になり、高精度なモデルを学習できないという問題が知られていた。
本技術では、学習時の不安定性を解消するための補正を加えながら学習することで、この問題を解決したという。
一般に、学習時に補正を加えると、学習が安定する代わりに、本来の目的である「対象物を正しく推定するモデルを学習」できる保証がなくなる。
今回開発したアルゴリズムは、「弱ラベル学習の安定化」と「正しいモデルの学習」の両方を同時に満たす。これにより、弱ラベルが付与されたデータからでも高精度なモデルを学習可能になるという。
>>ニュースリリース