学術&研究
![ディズニーの研究チームが二足歩行ロボット『BD_X』を発表ーー「強化学習」で表現力豊かな動きを実現のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/BDX_c9b72650ab/BDX_c9b72650ab.png)
ディズニーの研究チームが二足歩行ロボット『BD_X』を発表ーー「強化学習」で表現力豊かな動きを実現
ディズニーリサーチとウォルト・ディズニー・イマジニアリングの研究チームは2024年7月15日、エンターテインメント分野向けに特化した新しい二足歩行ロボット「BD_X」の設計と制御技術を[発表]{target=“_blank”}した。このロボットは、観客に対する魅力的なパフォーマンスを実現するために、芸術的な動きと動的な安定性を両立しているという。 @[YouTube] このロボットは、ディズニーキャラクターのような表現力豊かな動きを実現することを目的としている。ロボットが芸術的な動きをしながらも、バランスを保って安定して動くことができるように設計されている。 「BD_X」は、両足に5つの関節、首と頭に4つの関節を持つ。このため、複雑で多彩な動きを可能にしている。さらに、強化学習によりロボットが芸術的な動きを学習し、実行するという。 下図は、キャラクターデザインと制御の全体的な流れを示している。アニメーションとロボットの設計が互いに影響し合いながら進められ、最終的にはリアルタイムでの操作が可能になる。 ![bd_x1.jpg] :::small 画像の出典:[Disney Research]{target=“_blank”} ::: 強化学習とは、ロボットが試行錯誤を通じて最適な動きを学ぶ方法である。この技術を使って、ロボットはさまざまな動きや歩行を習得する。ディズニーの研究チームは、ロボットが立ったり歩いたり、特定の動作を繰り返したりするための複数の動きを学習させた。 実際の運用では、リモコンを使ってロボットを操作する。操縦者は、直感的な操作でロボットにさまざまな動きをさせることができる。この技術は、エンターテインメントだけでなく、教育や医療、サービス業などのさまざまな分野での応用が期待できるとのこと。 下図は、操縦者がロボットを操作し、人間と対話する様子を示している。上部の画像では、ロボットが紙巻きを見つけて、それをベンチの下に蹴り飛ばすシーンを演じている。下部の画像では、ロボットが人間に近づき、頭をなでられる様子を示している。このようにして、ロボットはさまざまな感情表現やインタラクションを実現する。 ![bd_x2.jpg] :::small 画像の出典:[Disney Research]{target=“_blank”} ::: :::box [関連記事:NVIDIA LLMベースの sim-to-real アプローチ「DrEureka」で、ロボット犬に玉乗りを教えるーシミュレーションから実世界への移行にかかる煩雑なプロセスを大幅に削減] ::: :::box [関連記事:AIがロボットを訓練「高速ペン回し」も教えるーーNVIDIA「Eureka」GPT-4搭載AIエージェント発表] :::
![Microsoftがスプレッドシートなどの表計算ソフトを理解できる大規模言語モデル「SpreadsheetLLM」を発表 複雑なスプレッドシートの処理を削減のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/Spreadsheet_LLM_1_1390569ae3/Spreadsheet_LLM_1_1390569ae3.png)
Microsoftがスプレッドシートなどの表計算ソフトを理解できる大規模言語モデル「SpreadsheetLLM」を発表 複雑なスプレッドシートの処理を削減
![OpenAI 開発コードは「Q*」から「Strawberry」に。推論能力を向上し、数学などの高正答率を目指す新たなAI技術の開発が進んでいるのサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/strawberry_f0e634a6e2/strawberry_f0e634a6e2.jpg)
OpenAI 開発コードは「Q*」から「Strawberry」に。推論能力を向上し、数学などの高正答率を目指す新たなAI技術の開発が進んでいる
![Google DeepMind Gemini1.5を使ってオフィス道順案内などのタスクを自然言語で実行させるのサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/mobility_vla0_side_eafa69a223/mobility_vla0_side_eafa69a223.jpg)
Google DeepMind Gemini1.5を使ってオフィス道順案内などのタスクを自然言語で実行させる
![スマホ上でも高速動作可能 NICTが21言語対応のニューラル音声合成技術を開発のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/nict_mobile_presen_tra_c67d566748/nict_mobile_presen_tra_c67d566748.jpg)
スマホ上でも高速動作可能 NICTが21言語対応のニューラル音声合成技術を開発
![10億のペルソナで合成データを生成、LLM開発に新たな可能性のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/persona_hub_1_5b2c75654f/persona_hub_1_5b2c75654f.jpg)
10億のペルソナで合成データを生成、LLM開発に新たな可能性
![LLMはRAGと事前知識をどう使い分けるのか マサチューセッツ大とMicrosoftの研究グループが発表のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/From_RA_Gstorich_parameters_f02bfa110d/From_RA_Gstorich_parameters_f02bfa110d.jpg)
LLMはRAGと事前知識をどう使い分けるのか マサチューセッツ大とMicrosoftの研究グループが発表
![OpenAI「現在ChatGPTはレベル1」AIシステムの進化を測定する新たな内部評価スケールを導入のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/AGI_level5_570b354f73/AGI_level5_570b354f73.jpg)
OpenAI「現在ChatGPTはレベル1」AIシステムの進化を測定する新たな内部評価スケールを導入
![SelfGoal: LLMエージェントの高難易度タスク解決を飛躍的に向上させる新手法のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/selfgoal_eyecatch_a41b938da4/selfgoal_eyecatch_a41b938da4.jpg)
SelfGoal: LLMエージェントの高難易度タスク解決を飛躍的に向上させる新手法
![内省メカニズムで進化するLLMエージェント「悪魔の代弁者」 GoogleDeepMindなどの研究チームが発表のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/devils_advocate_b20dc634c2/devils_advocate_b20dc634c2.jpg)
内省メカニズムで進化するLLMエージェント「悪魔の代弁者」 GoogleDeepMindなどの研究チームが発表
![神経系と連携し「義足が自分の体の一部と感じられる」自然な歩行を可能に MITの研究チームが発表のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/artificial_leg_replacements_3d5103d0c7/artificial_leg_replacements_3d5103d0c7.jpg)
神経系と連携し「義足が自分の体の一部と感じられる」自然な歩行を可能に MITの研究チームが発表
![Meta 従来の3~10倍速、60秒以内で高品質3Dアセットを生成する「Meta 3D Gen」を発表のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/Meta3_D_Gen_0dcf354f5e/Meta3_D_Gen_0dcf354f5e.jpg)
Meta 従来の3~10倍速、60秒以内で高品質3Dアセットを生成する「Meta 3D Gen」を発表
![長尺のビデオを理解する「LongVA」大規模マルチモーダルモデルの進化 シンガポールの研究グループが発表のサムネイル画像](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/longva_50b4af0bde/longva_50b4af0bde.jpg)
長尺のビデオを理解する「LongVA」大規模マルチモーダルモデルの進化 シンガポールの研究グループが発表
![TokyoSaunist](https://storage.googleapis.com/ledge-ai-prd-public-bucket/media/JAL_3_1_3794322e3d/JAL_3_1_3794322e3d.png)