AI物体検出アプリ作成を学べる 基礎からアプリケーションの作成方法までをまとめたコンテンツが公開中

このエントリーをはてなブックマークに追加

株式会社マクニカの公式サイト上で公開されている「物体検出アプリ開発に必要な知識」という記事コンテンツが話題だ。

このコンテンツはマクニカのエンジニアの経験をまとめたもので、第1話の「NVIDIA Jetsonで人物検知アプリの動作確認」から第6話「アプリケーションの作成」までを網羅している。第1話、第2話はオープンに公開されているため、ぜひともチェックしてみてほしい。3話以降については同社サイトにある購読フォームに必要事項を記入すれば、無料で読める。

なによりも話題になっている理由は、点在するAI物体検出アプリ開発の方法がひとまとまりになっている点。「この記事コンテンツを一通り読めば、物体検出アプリ開発がわかる」と言われるほどの中身だそうだ。それこそ、途中で出てくる単語や製品などの固有名詞についても解説が入っているため、「これから物体検出の開発に挑戦したい!」という方でも、読み進めやすいのがポイント。

本稿では第1話と第2話の内容をさくっと紹介したい。

第1話:NVIDIA Jetsonで人物検知アプリの動作確認
第2話:NVIDIA TAO TOOLKITとは、ジェスチャー識別アプリの動作確認

第1話:NVIDIA Jetsonで人物検知アプリの動作確認

第1話では、NVIDIAのJetsonで人物検知アプリをしっかり動作させられるか確認するところまで進む。ゴールは、対象となる映像データ内にクラス(識別名)と物体を含む矩形(バウンディングボックスの座標)をニューラルネットワークで推論し、結果を表示させることだ。もっとわかりやすくいえば、映像データに対して人がいればその部分を「人」と囲むところ、までである。

JetsonにUSBカメラを接続し、そのカメラで撮影した映像を使用した物体検出のデモ動作の確認までも解説している。

第2話:NVIDIA TAO TOOLKITとは、ジェスチャー識別アプリの動作確認

第2話では、第1話の内容から発展し、開発の要となるNVIDIA TAO TOOLKITについて理解を深めていき、推奨ハードウェアやNVIDIA TAO TOOLKITのサンプルアプリケーションの動作確認まで紹介している。

NVIDIA TAO TOOLKITとは、NVIDIA社が学習から推論に至るまでのアプリケーション開発をトータルで支援する仕組みとして提供しているツールキット。学習済みモデルを使用して転移学習させることにより、高度なAIアプリケーションの作成を支援してくれる。同ツールは、物体検出のほかに、画像分類やセグメンテーション、自然言語処理などの多様なニーズに対しての機能を備えている。なお、マクニカが公開しているコンテンツでは、物体検出の例を使用している。

第2話ではJetsonに接続されたカメラによって撮影した映像ストリームに対し、2段階の推論処理を組み込んだアプリケーションを実装していく。記事では、下記を目指している。
・推論処理1:手を検出します(後段の処理で手の部分の画像を切り出します)
・推論処理2:切り出された手の形状を識別し、以下のジェスチャーを判定します(Thumbs Up, Fist, Stop, Ok, Two, Random)

単純に“手”を検出するだけでなく、その手が何をしているのか、を認識させる段階だ。

第3話以降も公開中 データセットの準備から転移学習、推論モデルやアプリ作成まで

今回マクニカが公開している「物体検出アプリ開発に必要な知識」は全6話構成で下記となっている。
・第1話 NVIDIA Jetsonで人物検知アプリの動作確認
・第2話 NVIDIA TAO TOOLKITとは、ジェスチャー識別アプリの動作確認
・第3話 データセットの準備 
・第4話 転移学習
・第5話 推論モデル作成
・第6話 アプリケーション作成

後述のマクニカのサイトへのリンク先から必要事項を記入し送信すれば、続きを無料で読めるのでぜひともチェックしてみてほしい。なんといっても、この公開されているコンテンツを読むだけで、さまざまなサイトから必要事項を調べてピックしつつ試す……といった手間も省けるため、手軽に物体検出アプリの開発に挑戦できることは非常にありがたい限りだろう。

これから物体検出アプリの開発に挑戦しようと思っている方はもちろん、技術知識を得たい方にもオススメのコンテンツだ。