特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
1~13 / 637件
中国のテクノロジー企業Alibaba Group傘下のDAMO Academyは2026年2月13日、ロボットや自律機器向けのオープンソース基盤モデル「RynnBrain」を[発表]{target=“_blank”}した。実世界における空間・時間のダイナミクスに接地し、知覚・推論・計画を統合的に扱う“エンボディドAI”向けの時空間基盤モデルと位置付けられる。 ## 物理世界に接地した統合フレームワーク 論文によれば、RynnBrainは従来の視覚言語モデル(VLM)が抱えてきた課題――物理ダイナミクスへの内在的な接地の弱さや、時空間整合性を伴う推論の困難さ――に対応することを目的として設計された。 モデルは、以下の4つの能力軸を統合するフレームワークとして構築されている。 - 包括的なエゴセントリック理解 - 多様な時空間ローカライゼーション - 物理に接地した推論 - 物理制約を踏まえた計画(physics-aware planning) 実世界の環境下でロボットが「見て、理解し、推論し、行動計画を立てる」一連の処理を、空間情報と時間的変化を前提に統合することを目指す。 **■ RynnBrainの能力構成:認知(Cognition)、位置特定(Localization)、推論(Reasoning)、計画(Planning)を統合し、実世界の空間・時間ダイナミクスに接地した処理を行う** ![x3.jpg] :::small 画像の出典:[RynnBrain論文(Alibaba DAMO Academy)]{target=“_blank”} ::: ## 2B〜30B(MoE)まで3スケール展開、用途別派生も RynnBrainは、2B、8B、30B-A3B(Mixture-of-Experts構成)の3スケールで展開される。さらに、用途別にポストトレーニングを施した派生モデルとして、以下の4種が公開されている。 - RynnBrain-CoP(空間接地を挟んだ推論強化型) - RynnBrain-Nav(ナビゲーション向け) - RynnBrain-Plan(操作計画向け) - RynnBrain-VLA(視覚・言語・行動統合) 基盤にはQwen3-VLが採用されており、大規模な時空間データを用いた学習パイプラインを通じて、2000万超のサンプルにスケールさせたと説明している。 ## 28ベンチで評価、新設「RynnBrain-Bench」も公開 論文では、エンボディドAI関連20ベンチマークと、一般的な視覚理解8ベンチマークを含む計28評価で性能を検証したと報告している。位置特定や空間参照、操作計画などの項目において、既存のオープンモデルを上回る結果を示したとしている。 あわせて、長時間のエピソード動画全体にわたる時空間理解を測定する新評価スイート「RynnBrain-Bench」も公開された。同ベンチは3,616本の動画クリップ、577,998フレーム、12,000件の自由記述質問を含む構成とされる。 **■ RynnBrain-Benchの評価設計:空間認知、物体理解、接地推論、アフォーダンス、軌道理解など多層的な能力を横断的に測定する** ![x6.jpg] :::small 画像の出典:[RynnBrain論文(Alibaba DAMO Academy)]{target=“_blank”} ::: ## Apache 2.0で公開、複数プラットフォームから利用可能 RynnBrainはApache 2.0ライセンスの下で公開されており、プロジェクトページのほか、GitHub、Hugging Face、ModelScopeなどから利用可能とされる。 ロボットや自律機器の高度化を支える“頭脳”として、空間・時間ダイナミクスに接地した統合モデルをオープンソースで提示した点が特徴となる。今後は、実機応用やエージェントスタック全体への組み込み事例が注目される。 :::box [関連記事:Google、ロボット操作向けAI基盤モデル「Gemini Robotics 1.5」を発表──行動前に思考し、複雑タスクを実行] ::: :::box [関連記事:Google、オフライン環境で高精度動作するロボット用AI「Gemini Robotics On-Device」を公開] ::: :::box [関連記事:Figure社、AIロボットの協働技術「Helix」を発表 – 2体のヒューマノイドが冷蔵庫整理を実演] ::: :::box [関連記事:UCバークレー、「考えながら動く」ロボット制御技術「Real-Time Chunking(RTC)」を開発 - AIの思考時間を克服し、マッチ点火も実現] ::: :::box [関連記事:Google DeepMind ロボット動かすAI「RT-2」 ネットの知識活かし臨機応変に動作] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ