特集
FEATURE
ビジネス
BUSINESS
ラーニング
LEARNING
エンジニアリング
ENGINEERING
学術&研究
ACADEMICS & STUDY
公共
PUBLIC
エンタメ&アート
ENTERTAINMENT & ART
1~13 / 2720件
Luma AIは2026年3月6日(現地時間)、理解能力と生成能力を単一モデルに統合した次世代型画像生成モデル「Uni-1」を[発表]{target=“_blank”}した。Uni-1は、画像を生成するだけでなく、指示内容の理解や推論を同じモデルの中で扱う設計を採用している点が特徴だ。同社は、理解と生成を統合する「Unified Intelligence(統合知能)」への第一歩と位置づけている。 ## 理解と生成を一体で扱う新モデル Uni-1は、自己回帰型Transformer(文脈を踏まえながら順番に出力を組み立てる方式)を採用し、文章と画像を単一の系列として処理する。これにより、指示内容を理解して推論する処理と画像生成を一体で進められるという。 Luma AIは、こうした構造によって、AIが単に見栄えのよい画像を作るだけでなく、指示に含まれる要素同士の関係や場面の流れを踏まえながら画像を生成できるとしている。発表では、時間的な前後関係や空間的な配置、論理的な整合性といった要素を同時に扱える点を訴求した。 ## 推論性能を測る比較で既存モデルを上回る結果 Luma AIは、画像生成モデルの推論能力を測るベンチマーク「RISEBench」の結果も公開した。これは、因果関係、空間理解、時間理解、論理推論などを評価するもので、複雑な指示にどこまで整合的に応えられるかを見る指標として使われている。 **■ 図:画像生成モデルの推論性能を比較したRISEBench。Uni-1はNano Banana 2やGPT Image 1.5などを総合スコアで上回る結果を示した** ![rise-bench-chart-1600.jpg] :::small 画像の出典:[LumaAI]{target=“_blank”} ::: 公開されたグラフでは、Uni-1の総合スコアは0.51となり、Nano Banana 2やGPT Image 1.5などを上回った。項目別では、因果理解や空間理解でも高い値を示しており、Luma AIは、画像生成の品質だけでなく、指示内容を踏まえて場面を組み立てる力でも優位性があるとアピールしている。 ## 同一条件での生成比較も公開 Luma AIは、複数の画像生成モデルに同じ条件で指示を与えた比較例も公開した。会議室の中で猫がスライドを使って発表し、それを別の猫と人間が見ている場面など、複数の主体と役割を含むプロンプトで比較したもので、構図の整合性や場面理解の違いが分かる内容になっている。 **■ 図:同一プロンプトで生成した画像の比較。Uni-1、Nano Bananaシリーズ、GPT Image 1.5などの出力を並べた例** **左)プロンプト:参照画像の2匹の猫を、会議室の場面に合成。1匹がLumaAIのスライドを発表し、もう1匹が観察する。参照画像の2名の男性も座ってプレゼンに反応している/右)Uni-1の出力結果** ![odai-side.jpg] **左)NanoBanana/右)NanoBanana2** ![NB-side.jpg] **左)NanoBanana Pro/右)GPT Image1.5** ![NBP-side.jpg] :::small 画像の出典:[LumaAI]{target=“_blank”} ::: こうした比較例では、Uni-1は登場人物や動物の配置、発表と観察という役割の違い、室内の構図などを比較的自然に表現している。Luma AIは、こうした結果を、理解と生成を一体で扱う設計の成果として位置づけている。 ## 生成能力が視覚理解の向上にもつながると説明 同社はさらに、画像生成の能力を持つことが、視覚理解そのものの向上にもつながるとの考えを示している。これを示す例として、物体検出ベンチマーク「ODinW Dense Detection」の結果も公開した。 **■ 図:ODinW Dense Detection Accuracy。Uni-1のフルモデルは、理解専用モデルを上回る精度を示した** ![odinw-chart-1600.jpg] :::small 画像の出典:[LumaAI]{target=“_blank”} ::: 公開資料では、理解専用モデルのスコアが43.9だったのに対し、Uni-1のフルモデルは46.2を記録した。Luma AIはこの結果について、画像を生成するための学習が、物体や配置、場面を細かく見分ける力の向上にも寄与している可能性があるとしている。 ## 「Unified Intelligence」への第一歩 Luma AIは、Uni-1を単なる新しい画像生成モデルではなく、理解と生成の境界をまたぐモデルとして打ち出している。発表では、画像生成に加えて、世界知識や文化的文脈、複数ターンでの調整といった要素にも言及しており、より広いマルチモーダルAIへつながる基盤として位置づけた。 :::box [関連記事:Luma AI、テキストから画像を作る生成AI『Photon』を発表 他社にない「1枚の画像から複数の生成画像」機能も] ::: :::box [関連記事:Google、画像生成AI「Nano Banana 2(Gemini 3.1 Flash Image)」発表──Pro級の品質と“Flash級の速度”の良いとこどり] ::: :::box [関連記事:OpenAI、新モデル「GPT Image 1.5」搭載の「ChatGPT Images」を公開──GoogleのNano Banana Proに対抗] ::: :::box [関連記事:「理解」から「描写」へ Alibabaの画像生成AI「Qwen VLo」] :::
Ledge.aiにソリューション情報を掲載しませんか?
使い方や具体的な目標などを詳しくご説明します
お問い合わせ