東芝、重なった荷物を推定できるAIを開発 精度は45%改善

このエントリーをはてなブックマークに追加

株式会社東芝は11月30日、通常のカメラ(可視光カメラ)で撮影した画像から、不規則に積み重なった物体の個々の領域を高精度に推定する人工知能(AI)を開発したと発表。本AIを自動荷降ろしロボットなどの物流ロボットに搭載することで、荷降ろしやピッキングを正確に実現するという。

公開データを用いた本AIの実証実験においては、物体領域の推定における推定精度を従来方式から45%改善した。推定した領域と正解領域の重なりが75%以上であるときを正解としたときの正解率を比較した場合、世界トップの性能を達成したとうたう。

また、本AIは通常のカメラによる画像から領域を推定するため、従来の3次元センサーを用いたAIと比較して事前学習の手間を大幅に削減できる。現場での事前学習も必要なく、導入が容易とのこと。東芝は本AIを組み込んだ荷降ろしロボットを2021年度に市場投入予定としている。

AIが1つの物体であると誤認してしまう危険性があった

物流現場における自動化が進むなか、倉庫内の荷物の搬送のみならず、荷降ろしやピッキングなどの作業もロボットによる自動化が進められている。株式会社矢野経済研究所の調査によると、物流ロボットの市場は2030年度に、2020年度の約8倍の1500億円規模になると予測されているという。また、コロナ禍においては、倉庫のソーシャルディスタンスの確保のための物流ロボット導入がさらに加速することも想定される。

作業の自動化には、自動荷降ろしロボットやピッキングロボットが多種多様な荷物の領域を正しく認識し、的確につかむことが求められる。このためには、対象となる荷物を上から撮影した場合に、乱雑に積み重なり荷物同士が大きく重なった画像からでも、個々の荷物の領域を特定する技術が不可欠と言える。

荷物の領域の特定には3次元センサーを用いた手法がある。本手法は奥行きの測定に優れているため、重なり合う荷物の領域を高精度に特定できるものの、センサーのコストと事前学習のために必要となる3次元データの収集負担が高いといった課題があるという。

低コストで荷物の領域を特定する方法として、通常のカメラで撮影した画像を使用する技術が注目されているが、コスト・効率と精度はトレードオフの関係にあり、荷物同士が大きく重なった画像においては、AIが1つの物体であると誤認してしまう危険性があるとのこと。

今回、東芝は、物体の候補を点で推定する物体領域抽出方式を開発することで、乱雑に積み重なり荷物同士が大きく重なっているような状況でも、通常のカメラで上から撮影した画像から個々の荷物の領域を高精度に推定することに成功した。

荷物同士が大きく重なっているような状況でも推定できる

従来の物体領域抽出技術は、まず画像内に含まれる各物体を長方形で囲み、物体の領域の候補に挙げる。次に、長方形内に含まれる物体の領域を画素単位で推定することで、個々の物体の領域として認識する。しかし、荷物同士が大きく重なっていると、物体を囲む長方形も大きく重なり、1つの物体であると誤認してしまうなど、個々の荷物の領域を正しく認識できなかったという。

今回開発した方式では、まず事前学習をしたニューラルネットワークを用いて、画像内の画素ごとに、物体の特徴を示す特徴値を求める。同じ物体に属する点であれば似た特徴値、違う物体に属する点であれば異なる特徴値を出力する。次に、似た特徴値となった画素同士をまとめ、そのなかの代表点を物体の候補点に決める。最後に、候補点に対する物体の領域を画素ごとに推定する。

従来方式と比較して、より微小な範囲を物体の候補点として捉えるため、上下に重なる2つの物体においても1つの物体としてまとめて捉えずに、それぞれの領域を正しく推定できる。これらの技術をベースとしたAIの開発により、荷物同士が大きく重なっているような状況でも、上から撮影した画像から個々の荷物の領域を高精度に推定するとしている。

>>ニュースリリース

東芝、AIなど拠点に340億円投資は始まりに過ぎない

東芝はAI活用に積極的な企業として知られる。

同社は2022年1月に、神奈川県の川崎市にある同社グループの小向事業所内に、約340億円を投じて、AIなどの先端研究開発を手がけるランドマーク「研究開発新棟(仮称)」の建設に着手する。2023年4月の稼働を目指すとしている。

Ledge.ai編集部では、同施設について、「なぜこの金額を投資するにいたったのか?」「具体的にどのような研究開発をするのか?」など、東芝の広報に問い合わせた。東芝の広報担当者による回答が気になる人は、以下の記事をチェックしてほしい。