画像は公式サイトより
OpenAIが2021年1月5日(現地時間)に発表した、言葉を入力するだけで、それっぽいイラストや写真を生成できる「DALL・E(ダリー)」が話題を呼んでいる。「DALL・E」は、「鏡に映ったサングラスを見つめるピカチュウ」や「チュチュを着て犬を散歩させる大根の赤ちゃん」といった言葉を入力すると、それらの言葉にふさわしい画像を生み出してくれる。
なお、OpenAIは、宇宙開発企業スペースXの共同設立者およびCEO、テスラの共同設立者およびCEOなどを務めるイーロン・マスク氏らが作った非営利団体である。ほかには、言語モデル「GPT-3」などで知られる。
日本のSNS上では、「DALL・E」について、「すげー!」「とんでもない」「早く使いたい」など、技術を絶賛する声が多く見受けられる。この記事では、同技術で生み出されたイラストや写真を紹介したい。
鏡に映ったサングラスを見つめるピカチュウ
公式サイトより
チュチュを着て犬を散歩させる大根の赤ちゃん
公式サイトより
アボカドのような形をした椅子
公式サイトより
「OpenAI」という看板を掲げた店
公式サイトより
五角形の緑色の時計
公式サイトより
ヤマアラシのようなキューブ
公式サイトより
テーブルの上に乗っている眼鏡
公式サイトより
キリンを模したカメ
公式サイトより
日本料理
公式サイトより
サンフランシスコのゴールデン・ゲート・ブリッジ
公式サイトより
「GPT-3」の画像版か
公式サイトによると、「DALL・E」は、テキストと画像のペアのデータセットを使用し、テキストの説明から画像を生成するために訓練された120億パラメータバージョンの「GPT-3」という。
「GPT-3」とは、OpenAIが2020年6月に発表した言語モデルである。英語圏を中心に「この言語モデルは危険すぎる」「新たなブレイクスルーだ」など多くの議論を生み出した。今回発表した「DALL・E」は「GPT-3」の画像版と捉えることもできる。
なお、「DALL・E」の名前は、芸術家サルバドール・ダリと、2008年に公開されたディズニー/ピクサーのアニメーション映画『ウォーリー』(原題: WALL-E)』を組み合わせたものとのこと。気になる人は公式サイトを覗いてみては。