特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
Google DeepMindは2025年6月24日、完全オフライン環境下で動作可能なロボット向けVLA(Vision-Language-Action)モデル「Gemini Robotics On‑Device」を[発表]{target=“_blank”}した。 インターネット接続が不要で、自然言語による指示をもとに高精度な物理タスクを実行可能とされる。発表と同時に、開発者向けSDKの提供も開始され、既に複数のロボットプラットフォームで検証が進められている。 ## 通信環境に依存しないロボットAIの展開 このモデルは、2025年3月に公開された[Gemini Robotics]{target=“_blank”}モデルのオンデバイス特化版であり、クラウド接続に頼らずリアルタイムでの意思決定・動作制御が可能となっている。Googleは、通信の断続や遅延が発生しやすい工場、倉庫、災害現場などの環境において、より信頼性の高いAIロボット運用を実現する手段として本技術を位置づけている。 モデルは、視覚情報、自然言語、行動計画を統合的に処理する構造を採用。たとえば「バッグのジッパーを開ける」「衣服を折りたたむ」といった高度なマニピュレーションタスクを、あらかじめ訓練されていない新しい対象物や環境下でも実行できるという。 ## クラウド並みの性能と高速な適応性 ベンチマークでは、オンデバイスモデルでありながら、クラウド版のGemini Roboticsに匹敵する性能を示したとされる。従来の軽量ローカルモデルと比較しても、特に複雑な指示や分布外タスクにおいて優れたパフォーマンスを発揮したという。 新たなタスクや異なるロボット構成に対する適応も迅速であり、50~100回程度の実演データ(少数ショット)で学習が可能とされている。これにより、開発者は自社のロボットや環境に即したタスク実装を短期間で行うことができる。 ![unnamed (1).jpg] 100 個未満の例を使用した、Gemini Robotics On-Device のタスク適応パフォーマンスを示すグラフ ## 複数ロボットプラットフォームでの実証 同モデルは、当初ALOHAロボット上で訓練されたが、現在では以下のような複数のプラットフォームで動作検証が行われている: - **Franka FR3(双腕ロボット)** :ベルトコンベア上での部品組み立てや衣類の折りたたみといった、高精度かつ器用な作業の自律実行。 - **Apptronik Apollo(人型ロボット)** :形状の大きく異なるロボットにもかかわらず、同一のモデルが自然言語指示に基づく操作を実現。 ![google robotics.jpg] :::small 画像の出典:[GoogleDeepMind]{target=“_blank”} ::: これらの検証は、視覚・動作・言語の汎化能力が特定のロボット形状に依存しないことを示すものであり、将来的なマルチプラットフォーム展開の足掛かりとされる。 ## SDKと開発支援環境の提供 Googleは本モデルに対応した開発者向けのGemini Robotics SDKも同時に発表した。このSDKは、物理ベースの動力学シミュレーター「MuJoCo(Multi-Joint dynamics with Contact)」と統合されており、仮想環境下でのタスク設計・検証が可能。開発者は、安全な仮想空間でモデルの適応性やパフォーマンスを確認した上で、物理環境に展開できる。 また、本モデルはファインチューニングが可能な初のVLAモデルとされ、既存の機能をそのまま使用するだけでなく、特定の業務ニーズに合わせた最適化も可能である。 ## 安全設計と段階的提供 Googleによれば、Gemini Robotics On‑Deviceは、同社のAI原則に準拠した安全設計のもと開発されており、物理的・意味的なリスクに配慮した運用が前提となっている。動作時には、低レベル制御層でのセーフティモデルと接続されており、Live API経由での行動モニタリングも実施される。 公開初期段階では「trusted testers(信頼できる試験ユーザー)」のみに提供され、実地環境での安全性・応答性を確認した上で、将来的にはより広範な提供が予定されている。 ## 今後の展望と企業導入への示唆 Google DeepMindは、本技術によりロボティクスの現場導入が加速すると見ており、特にネットワーク制限が厳しい産業現場・災害対策・セキュア施設などでの有用性を想定している。クラウドとオンデバイスの両方向を同時にカバーする戦略により、同社は幅広いニーズに対応するロボットAIの基盤形成を進めている。 :::box [関連記事:Google、ロボット向けAI「Gemini Robotics」を発表──AIが物理世界で動作する新時代へ] ::: :::box [関連記事:Google DeepMind、ロボットアームで「靴ひもを結ぶ」などの器用さを革新する新技術を発表] ::: :::box [関連記事:Google DeepMind ロボット動かすAI「RT-2」 ネットの知識活かし臨機応変に動作] ::: :::box [関連記事:Figure 02が自然な“行進”を披露──強化学習でヒューマノイドの歩行がここまで進化] ::: :::box [関連記事:Hugging Face、低価格・自作可能なAIロボットアーム「SO-101」を発表ー ”AIビルダーが最初に購入すべきロボットアーム”] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ