コンピューターはマイケルジョーダンを生むか。人工知能がバスケットボールのドリブルを習得するまで

このエントリーをはてなブックマークに追加

人が何かを習得しようとするとき、練習は不可欠です。そしてそれは現在のコンピュータも同様なようです。ではコンピューターがなにかを練習するとき、人間との違いはあるのでしょうか。

アメリカのカーネギーメロン大学とディープモーション社が共同で、ディープラーニングを用いたシミュレータにバスケットボールのドリブルを習得させる研究をおこないました。アニメーション化されたシミュレータはどのように学習しどのようなアウトプットを出したのでしょうか。

人のドリブルの動きをモーションキャプチャから学習させる

この研究では、モーションキャプチャという技術を使い人が実際にドリブルしている様子をコンピューターに読み込ませ学習させたそう。はじめに人の動きかたと手の使い方のみを学習させた後、学習させた動きをボールの動きと組み合わせ、ドリブルを学習させたようですね。

モーションキャプチャ
人間やモノの動きを様々な角度から撮影し、デジタル化する技術。
スポーツや運動科学のための運動分析やアニメ、映画などの映像製作におけるCGにも頻繁に使われている。

Photo by Giphy

学習初期段階でのシミュレータの動きはとてもたどたどしく、滑らかにドリブルできるようになるまでに何百万回ものシミュレーションが行われたようです。

ボールの動きは複雑で予測困難なため単純化し、ボールの動き方は手によって生み出される軌道を最適化する計算方法で算出したそう。

基本的なドリブル習得後の応用が短時間で可能

ボールをつくだけのドリブルには数百万回のシミュレーションを要しましたが、一度それをマスターすると他の両手を使ったドリブルや、そのほかのボールの扱いはすぐにできたようです。

人間においては一つのドリブル技術を習得しても複雑な動きを加えるにはさらに同程度の練習が必要なことが多いので、この点においてはコンピューターの方が優れているのかもしれません。

考えられる理由としては、コンピューターは「ドリブルという行為」自体を認識せず、「学習した手と体の動き、それに伴うボールの扱い方」のみを実行するので汎用性が高く、短時間での応用が可能になるのではないかと思います。

この汎用的な学習方法は1を教えて1を学ばせる従来の機械学習モデルとは大きく異なります。コンピューターの汎用性を利用した機械学習は特化型人工知能(Narrow AI)の開発ではなく、汎用型人工知能(Artificial General Intelligence(AGI))の開発の手がかりになるかもしれません。

特化型人工知能(Narrow AI)
いわゆる特定の業務のみを最適に行う人工知能。現在世に出ているほとんどの人工知能はここに属する。

汎用型人工知能(Artificial General Intelligence(AGI))
一つのタスクだけでなく、人間のように複数の処理を行うことができる人工知能。しかし、開発にはさまざまな問題が多く、
技術的な難しさだけでなく、その定義すら未だにはっきりされていない。

参考:「強いAIと弱いAI」

ドリブル学習から見るこれからのディープラーニング

何百万回もの練習がなされたものの、動画を確認するに1回目からドリブル自体はできているように見えます。これは学習自体の精度はかなり高くなっている兆しかと。

しかし、今回のドリブル学習のキーは、ドリブルのハンドリングや、動きを正確に再現するアニメーションアバターの手の作りと、洗練されたボールの軌道予測であるとも考えられます。

アニメーションシミュレータには人工骨格モデルを使用。首は浮遊している関節を、そしてその他内側には人工関節モデルを使用。身体に負荷をかけることのできるシステムを導入している。動くたびに身体のバランスと腕の制御システムがそれぞれの関節の動かし方を計算する。
シミュレータの手は5つの独立可動部位で構成されている。指の動きには余分な可動部位があることが知られている。指の表面の赤い点はボールから手までの距離を計算する役目を果たしている。

さらに今回の学習では「ボールをドリブルする」そのものの行為ではなく、手や腕の動きを学ばせてボールの動きに対応させるという、いわゆる「ボトムアップ」なアプローチがなされています。

このアプローチをとることで、Emergent behaviorと称される、学習されたシミュレータが課されたタスクに対し”自ら”直接学習されていない適切な行動をとり始める現象を生みます。

これは去年発表されたOpen AIのCompetive Self PlayDeepMindのParkour Simulationでも同様のことが確認されています。

Open AIのCompetitive Self Play
Open AIとはイーロンマスクをはじめとする有力投資家、実業家が参加してる、人工知能を人類の敵ではなく利益となるよう設立された非営利団体。強化学習アルゴリズムの検証プラットフォームなどももつ。
Competitive Self PlayはOpen AIの開発した強化学習を用いた3Dシミュレーター。シンプルな学習から、学習させていないさまざまな行動が自発的に発生した。
DeepMindのParkour Simulation
DeepMInd社はGoogle傘下の人工知能を扱う企業。世界初人間のプロ囲碁棋士を破ったAlphaGoの開発などでも有名。Parkour(パルクール)とは移動動作を用いて、人が持つ本来の身体能力を引き出し追求する方法である。Open AI同様、シンプルな学習インプットから自発的に最適な行動を生み出した。

このように、より正確なディープラーニングの成果を出すには、潤沢な環境とデータ供給できるだけ最低限でシンプルな学習が重要なポイントになってくると考えられます。

モーションシミュレータの可能性

現在出ているバスケットボールゲームなどのキャラクター動作は、ほとんどが人工的な組み込みで作られており、あらかじめ作られた動作のみしかできません。より厳密で現実に近い動き方は、今回のような機械学習を応用したシミュレータを用いると可能性がひらけてきます。

この技術がより進化し汎用されれば、複雑なスポーツの動き方だけでなく、環境が作用したときの人間の動き方がシミュレーション可能になると考えられます。(たとえば車の事故時の人間の動かされ方など)

直近ではやはり映画、アニメやゲームのよりリアルで滑らかなキャラクター製作が劇的に向上することが見込まれます。さらに、学習外の最適な行動をとるキャラクターが確立されれば、人間とバーチャルが相互作用する”体験型”のバーチャル産業もよりり現実味を帯び、映像エンタメが新しい境地に達するでしょう。

アニメ・ゲーム産業に強い日本もこれからはこのような最新技術を用いてより洗練されたプロダクトを実現していくのかもしれません。今後が楽しみです。

Source: DeepDribble: Simulating Basketball with AI