学術&研究

1~13 / 629件

学術&研究
2026/2/2 [MON]
“プロンプトで歩ける世界”が現実に──Google、世界生成AIの実験プロトタイプ「Project Genie」米国提供 Google DeepMindの世界モデル「Genie 3」を搭載のサムネイル画像

“プロンプトで歩ける世界”が現実に──Google、世界生成AIの実験プロトタイプ「Project Genie」米国提供 Google DeepMindの世界モデル「Genie 3」を搭載

Googleは2026年1月29日(現地時間)、テキストや画像から対話型の仮想世界を生成・探索できる実験的なプロトタイプ「Project Genie」を[公開]{target=“_blank”}した。まずは米国の「Google AI Ultra」ユーザーを対象に提供する。 ## テキストや画像から対話型の仮想世界を生成 Project Genieは、ユーザーが自然言語の指示や画像を入力すると、AIが仮想空間を生成し、その中を移動・操作しながら探索できる点が特徴だ。生成された世界は静的な3Dモデルではなく、視点移動や操作に応じて周囲の環境がリアルタイムに構築される。 同プロトタイプでは、体験は三つの中核機能で構成されている。テキストや生成・アップロードした画像を用いて環境を作成する「World sketching」、生成された世界の中を歩行や飛行、乗り物での移動などを通じて体験する「World exploration」、既存の世界を基に新たな解釈を加える「World remixing」だ。 作成前には世界の見た目をプレビューし、視点を一人称・三人称から選択することもできる。 @[YouTube] ## 世界モデル「Genie 3」を中核に据えた構成 技術面では、Google DeepMindが開発した世界モデル「Genie 3」を中核に据える。ユーザーの行動に応じて進行方向の環境を生成する仕組みを採用し、物理挙動や相互作用を含む動的な世界をシミュレーションする。プロトタイプはGenie 3に加え、画像生成モデル「Nano Banana Pro」や対話型AI「Gemini」を組み合わせたWebアプリとして提供されている。 ## 米国のGoogle AI Ultraユーザー向けに限定提供 Project GenieはGoogle Labsにおける実験的研究プロトタイプとして提供される。現時点では米国在住の18歳以上で、「Google AI Ultra」に加入しているユーザーに限定されている。生成した世界や探索の様子は動画としてダウンロードすることも可能だ。 Googleは、現段階では生成結果が必ずしも現実世界の物理や入力内容に完全に一致しない場合があるほか、操作時の遅延や生成時間が最大60秒に制限されている点など、いくつかの制約があるとしている。一部のGenie 3の機能も本プロトタイプには含まれていない。今後はユーザーからのフィードバックを基に改良を進め、提供地域を段階的に拡大していく方針だ。 :::box [関連記事:テキスト一行で3D世界が動く──Google DeepMind、新AIモデル「Genie 3」を公開] ::: :::box [関連記事:Google DeepMind、基盤ワールドモデル「Genie 2」発表:無限に広がる3D環境で汎用AIエージェントの開発を加速] ::: :::box [関連記事:Google DeepMind、「SIMA 2」研究プレビュー公開──Gemini搭載で推論・一般化・自己改善が進化、生成3D世界にも対応] ::: :::box [関連記事:Google、「Nano Banana Pro」を発表──4K対応・多言語テキスト描画を強化した最新画像生成AI] ::: :::box [関連記事:Google、「Gemini 3」を正式発表──推論・マルチモーダル性能を強化した最新モデル、本日より提供開始] :::

mailmagazine_Benefit_260109
FOLLOW US
各種SNSでも最新情報をお届けしております