「音声よりも早く、直感的?」ビジョンアシスタントが実現するスマートライフ

piccolo10
このエントリーをはてなブックマークに追加


みなさん、スマートスピーカーや音声アシスタントを使ったことはありますか?

声を使ってあれこれ命令することができる音声アシスタントですが、まだまだ課題が多いのも事実。

今日は、スマートスピーカーよりももっと楽かもしれない「ビジョンアシスタント」を紹介します。

ジェスチャーを認識して家具をコントロール可能!

piccolo1

「Piccolo」は、人のジェスチャーを認識して、直感的に家具コントロールを可能にするにビジョンアシスタントです。

ユーザーはテレビやスピーカー、電気などのデバイスを身体ジェスチャーで操作することができます。

音声認識とは異なり、何かに話しかける必要がないので、話すのが恥ずかしい人にぴったりです。また、スマートスピーカーに「動画を巻き戻して」と言うよりも早く、直感的な操作を可能にします。

piccolo
手を左に動かす動作を「Action Rewind」と認識

身体を使った操作だから誰でも使える!

piccolo2

公開されている「Piccolo」デバイス

「Piccolo」の使い方は簡単です。まず、ビジョンアシスタント「Piccolo」を自宅におき、おいたデバイスを指差していると、「Piccolo」がモーショントラッキングをはじめます。

そこから指定されたジェスチャーを「Piccolo」が認識して、ユーザーがどこを指しているのかを理解し、スマート家電を操作することができます。

piccolo3

「Piccolo」自体は、Apple TVやGoogle chome、dyson、Hueライトなどと連携可能。ジェスチャーだけで家具のコントロールを実現します。

仕組みとしては、モーショントラッキング、姿勢推定、3D再構成、深層学習を用いて人の動きを認識しているようです。

公式サイトによると、今後はジェスチャーアプリを誰でも開発可能にするそうです。

また、「家の動画をとられたくない……。」という声もあると思います。そこに対しては、通常の画像処理はデバイス上で行われ、複雑なAIモデルを実行する際のみクラウド上で処理が行われるようです。

ビジョン認識は音声認識と合わせることで力を発揮する

ビジョン認識は一見、音声認識よりも扱いやすいようにみえますが、音声認識ほどの自由度の実現は難しいかと。

いろいろな組み合わせができる言葉と比較して、ジェスチャーは誰もが使えるようにすると、種類を絞るしかないですし……。

ただ、単純な操作の場合は、音声認識よりも「より早く、よりストレスなく」使えると思います。

そういう意味では、音声認識とビジョン認識は両方をお互いの欠点を補いながら利用するのがよさそうです。

ビジョンアシスタントの可能性

音声ではなく、手の動きによる家具操作は、あまり喋りたくない人にとってベターな方法だと思います。

また、特殊なセンサーを必要としない深層学習によるビジョン認識は、高価なハードウェアを買う必要がなく、一般的な家庭でも導入しやすいですし。

認識精度は現時点でわかりませんが、実用的なスマートアシスタントとして、ビジョンアシスタントは現実的アイデアかもしれません。