学術&研究

学術&研究
2024/7/26 [FRI]
ディズニーの研究チームが二足歩行ロボット『BD_X』を発表ーー「強化学習」で表現力豊かな動きを実現のサムネイル画像

ディズニーの研究チームが二足歩行ロボット『BD_X』を発表ーー「強化学習」で表現力豊かな動きを実現

ディズニーリサーチとウォルト・ディズニー・イマジニアリングの研究チームは2024年7月15日、エンターテインメント分野向けに特化した新しい二足歩行ロボット「BD_X」の設計と制御技術を[発表]{target=“_blank”}した。このロボットは、観客に対する魅力的なパフォーマンスを実現するために、芸術的な動きと動的な安定性を両立しているという。 @[YouTube] このロボットは、ディズニーキャラクターのような表現力豊かな動きを実現することを目的としている。ロボットが芸術的な動きをしながらも、バランスを保って安定して動くことができるように設計されている。 「BD_X」は、両足に5つの関節、首と頭に4つの関節を持つ。このため、複雑で多彩な動きを可能にしている。さらに、強化学習によりロボットが芸術的な動きを学習し、実行するという。 下図は、キャラクターデザインと制御の全体的な流れを示している。アニメーションとロボットの設計が互いに影響し合いながら進められ、最終的にはリアルタイムでの操作が可能になる。 ![bd_x1.jpg] :::small 画像の出典:[Disney Research]{target=“_blank”} ::: 強化学習とは、ロボットが試行錯誤を通じて最適な動きを学ぶ方法である。この技術を使って、ロボットはさまざまな動きや歩行を習得する。ディズニーの研究チームは、ロボットが立ったり歩いたり、特定の動作を繰り返したりするための複数の動きを学習させた。 実際の運用では、リモコンを使ってロボットを操作する。操縦者は、直感的な操作でロボットにさまざまな動きをさせることができる。この技術は、エンターテインメントだけでなく、教育や医療、サービス業などのさまざまな分野での応用が期待できるとのこと。 下図は、操縦者がロボットを操作し、人間と対話する様子を示している。上部の画像では、ロボットが紙巻きを見つけて、それをベンチの下に蹴り飛ばすシーンを演じている。下部の画像では、ロボットが人間に近づき、頭をなでられる様子を示している。このようにして、ロボットはさまざまな感情表現やインタラクションを実現する。 ![bd_x2.jpg] :::small 画像の出典:[Disney Research]{target=“_blank”} ::: :::box [関連記事:NVIDIA LLMベースの sim-to-real アプローチ「DrEureka」で、ロボット犬に玉乗りを教えるーシミュレーションから実世界への移行にかかる煩雑なプロセスを大幅に削減] ::: :::box [関連記事:AIがロボットを訓練「高速ペン回し」も教えるーーNVIDIA「Eureka」GPT-4搭載AIエージェント発表] :::

学術&研究
2024/7/22 [MON]
Microsoftがスプレッドシートなどの表計算ソフトを理解できる大規模言語モデル「SpreadsheetLLM」を発表 複雑なスプレッドシートの処理を削減のサムネイル画像

Microsoftがスプレッドシートなどの表計算ソフトを理解できる大規模言語モデル「SpreadsheetLLM」を発表 複雑なスプレッドシートの処理を削減

Microsoft
基盤モデル
学術&研究
2024/7/20 [SAT]
OpenAI 開発コードは「Q*」から「Strawberry」に。推論能力を向上し、数学などの高正答率を目指す新たなAI技術の開発が進んでいるのサムネイル画像

OpenAI 開発コードは「Q*」から「Strawberry」に。推論能力を向上し、数学などの高正答率を目指す新たなAI技術の開発が進んでいる

OpenAI
基盤モデル
学術&研究
2024/7/19 [FRI]
Google DeepMind Gemini1.5を使ってオフィス道順案内などのタスクを自然言語で実行させるのサムネイル画像

Google DeepMind Gemini1.5を使ってオフィス道順案内などのタスクを自然言語で実行させる

Google
AIエージェント
学術&研究
2024/7/16 [TUE]
スマホ上でも高速動作可能 NICTが21言語対応のニューラル音声合成技術を開発のサムネイル画像

スマホ上でも高速動作可能 NICTが21言語対応のニューラル音声合成技術を開発

学術&研究
2024/7/15 [MON]
10億のペルソナで合成データを生成、LLM開発に新たな可能性のサムネイル画像

10億のペルソナで合成データを生成、LLM開発に新たな可能性

基盤モデル
学術&研究
2024/7/13 [SAT]
LLMはRAGと事前知識をどう使い分けるのか マサチューセッツ大とMicrosoftの研究グループが発表のサムネイル画像

LLMはRAGと事前知識をどう使い分けるのか マサチューセッツ大とMicrosoftの研究グループが発表

論文
学術&研究
2024/7/13 [SAT]
OpenAI「現在ChatGPTはレベル1」AIシステムの進化を測定する新たな内部評価スケールを導入のサムネイル画像

OpenAI「現在ChatGPTはレベル1」AIシステムの進化を測定する新たな内部評価スケールを導入

OpenAI
学術&研究
2024/7/12 [FRI]
SelfGoal: LLMエージェントの高難易度タスク解決を飛躍的に向上させる新手法のサムネイル画像

SelfGoal: LLMエージェントの高難易度タスク解決を飛躍的に向上させる新手法

AIエージェント
論文
学術&研究
2024/7/11 [THU]
内省メカニズムで進化するLLMエージェント「悪魔の代弁者」 GoogleDeepMindなどの研究チームが発表のサムネイル画像

内省メカニズムで進化するLLMエージェント「悪魔の代弁者」 GoogleDeepMindなどの研究チームが発表

Google
AIエージェント
学術&研究
2024/7/10 [WED]
神経系と連携し「義足が自分の体の一部と感じられる」自然な歩行を可能に MITの研究チームが発表のサムネイル画像

神経系と連携し「義足が自分の体の一部と感じられる」自然な歩行を可能に MITの研究チームが発表

論文
近未来
学術&研究
2024/7/9 [TUE]
Meta 従来の3~10倍速、60秒以内で高品質3Dアセットを生成する「Meta 3D Gen」を発表のサムネイル画像

Meta 従来の3~10倍速、60秒以内で高品質3Dアセットを生成する「Meta 3D Gen」を発表

Meta
論文
学術&研究
2024/7/7 [SUN]
長尺のビデオを理解する「LongVA」大規模マルチモーダルモデルの進化 シンガポールの研究グループが発表のサムネイル画像

長尺のビデオを理解する「LongVA」大規模マルチモーダルモデルの進化 シンガポールの研究グループが発表

マルチモーダルAI
アクセスランキング
JR西日本、世界初の人型重機ロボットを鉄道設備メンテナンスに導入
一般にはほぼ無名のAIエンジニア安野たかひろ氏が、急激に支持者を集め都知事選で15万票を獲得するまでを振り返る 最新小説も発売!
Microsoftがスプレッドシートなどの表計算ソフトを理解できる大規模言語モデル「SpreadsheetLLM」を発表 複雑なスプレッドシートの処理を削減
4
ディズニー内部Slackデータ1.1TiB流出「生成AIからアーティストの権利を擁護するハッカー集団」Nullbulgeの攻撃
5
LoRA(ローラ)とは|今年注目の画像生成AI (Stable Diffusion) のファインチューニングを試してみた
TokyoSaunist
FOLLOW US
各種SNSでも最新情報をお届けしております