特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
1~13 / 340件
AI動画生成企業 Runway は12月1日、次世代動画モデル「Runway Gen-4.5」を[発表]{target=“_blank”}した。同社によると、物理挙動の再現精度、プロンプト追従性、カメラワークの精密さが大幅に向上しており、動画生成AIのベンチマーク「Artificial Analysis」Text-to-Video リーダーボードで Elo 1247 を記録。Googleの「Veo 3」やOpenAIの「Sora 2 Pro」など、主要モデルを上回る世界最高スコアとなった。 Runwayは公式リリースで、Gen-4.5を「動画モデルの新たな基盤(foundation model)」と位置づけている。開発コードネームは「Whisper Thunder(David)」。研究段階から推論まで、すべての工程を NVIDIA GPU 上で実施し、Blackwell/Hopper 世代向けに最適化されている。 @[YouTube] ## 複雑なカメラワーク・構図理解が大幅に向上 Gen-4.5は、複雑なカメラの移動、複数要素が連続して発生する構図、シーン内の細かなイベント進行などを単一プロンプトで制御可能となった。 Runwayは「細かいカメラの振り、構図の変化、時間経過による変化まで正確に理解する」と説明している。 ## 物理再現性は「重さ」「質感」「自然な動き」を強化 新モデルでは、物体の重量感・慣性・表面反射・素材感などの物理表現が精密化。風・煙・水の挙動など、自然現象の再現精度も向上した。同時に、物理法則を遵守する演出だけでなく、クリエイターが意図的に“非現実的な世界”を作る演出も柔軟に実行できる。 ## 世界最高スコア:Elo 1247、他社を大きくリード Runwayが公開したベンチマークでは、Gen-4.5は Elo 1247 を記録し、主要動画生成モデルを上回った。 - Runway Gen-4.5:1247 - Google Veo 3:1226 - Kling 2.5:1225 - Veo 3.1:1223 - OpenAI Sora 2 Pro:1206 ![gen-4.5-chart-revised-01.jpg] :::small 画像の出典:[Runway]{target=“_blank”} ::: 動画生成AIの性能を示す指標として注目されるEloスコアで、Runwayは明確な優位性を示した。 ## NVIDIAと全面協業、最適化された推論パイプライン Gen-4.5は研究・前処理・後処理・推論まで、全工程を NVIDIA GPU 上で構築。NVIDIAのJensen Huang CEOは以下のコメントを寄せている。 「Runwayが NVIDIA GPU 上で革新的な動画・ワールドモデルを構築したことを誇りに思う。AIの全ライフサイクルを共に前進させるため、協業を続ける」 ## 既存のコントロールモードも統合予定 Gen-4.5では、Text-to-Videoに加えて以下の機能が順次統合される予定だ。 - Image to Video - Video to Video - Keyframes - その他の既存コントロール機能 プロ向けの高度なワークフローを支える構造となっている。 ## 透明性として「現状の限界」も明示 Runwayは、Gen-4.5において依然として課題が残る点も公開している。 因果関係の理解が不完全 物体恒常性(object permanence)の失敗ケース これらの改善を今後の「world modeling」の重要テーマと位置づけ、継続して研究を進めると説明した。 ## 数日以内に全ユーザーへ提供開始 Gen-4.5は段階的にロールアウトが始まっており、数日以内にRunwayのユーザー全体へ展開される予定。Gen-1、Gen-2、Gen-3から続く進化の集大成として、Runwayは「新しい動画生成の標準点をつくる」としている。 :::box [関連記事:Sora以後、動画生成AIモデルのリリース続く Runwayも「Gen-3 Alpha」を発表] ::: :::box [関連記事:Google、生成AI新モデル「Veo 3」「Imagen 4」「Flow」を発表 ─ 音声付き動画生成と映画制作ツールで創造性を拡大] ::: :::box [関連記事:OpenAI、次世代動画生成モデル「Sora 2」を発表──自分や友人が出演する動画を生成できるiOSアプリ「Sora」も米国とカナダで同時公開] ::: :::box [関連記事:Google、動画生成AI「Veo 3.1」を発表──1分超のシーン拡張「Extend」搭載、Flowと統合強化] ::: :::box [関連記事:Midjourney、同社初のAI動画生成モデル「V1」を公開 最大21秒のテキストto動画生成に対応] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ