「サングラス姿のピカチュウ」や「大根の赤ちゃん」を言葉からイラスト化するAI「DALL・E」が話題に

このエントリーをはてなブックマークに追加

画像は公式サイトより

OpenAIが2021年1月5日(現地時間)に発表した、言葉を入力するだけで、それっぽいイラストや写真を生成できる「DALL・E(ダリー)」が話題を呼んでいる。「DALL・E」は、「鏡に映ったサングラスを見つめるピカチュウ」や「チュチュを着て犬を散歩させる大根の赤ちゃん」といった言葉を入力すると、それらの言葉にふさわしい画像を生み出してくれる。

なお、OpenAIは、宇宙開発企業スペースXの共同設立者およびCEO、テスラの共同設立者およびCEOなどを務めるイーロン・マスク氏らが作った非営利団体である。ほかには、言語モデル「GPT-3」などで知られる。

日本のSNS上では、「DALL・E」について、「すげー!」「とんでもない」「早く使いたい」など、技術を絶賛する声が多く見受けられる。この記事では、同技術で生み出されたイラストや写真を紹介したい。

鏡に映ったサングラスを見つめるピカチュウ

公式サイトより

チュチュを着て犬を散歩させる大根の赤ちゃん

公式サイトより

アボカドのような形をした椅子

公式サイトより

「OpenAI」という看板を掲げた店

公式サイトより

五角形の緑色の時計

公式サイトより

ヤマアラシのようなキューブ

公式サイトより

テーブルの上に乗っている眼鏡

公式サイトより

キリンを模したカメ

公式サイトより

日本料理

公式サイトより

サンフランシスコのゴールデン・ゲート・ブリッジ

公式サイトより

「GPT-3」の画像版か

公式サイトによると、「DALL・E」は、テキストと画像のペアのデータセットを使用し、テキストの説明から画像を生成するために訓練された120億パラメータバージョンの「GPT-3」という。

「GPT-3」とは、OpenAIが2020年6月に発表した言語モデルである。英語圏を中心に「この言語モデルは危険すぎる」「新たなブレイクスルーだ」など多くの議論を生み出した。今回発表した「DALL・E」は「GPT-3」の画像版と捉えることもできる。

なお、「DALL・E」の名前は、芸術家サルバドール・ダリと、2008年に公開されたディズニー/ピクサーのアニメーション映画『ウォーリー』(原題: WALL-E)』を組み合わせたものとのこと。気になる人は公式サイトを覗いてみては。