DALL-E、AIによる近代芸術

OpenAIの新しい画像生成モデル

DALL-Eを紹介します。

「DALL-E」はテキストと画像のペアのデータセットを使用して、自然言語から画像を生成するように学習した「GPT-3」の120億パラメータ版です。文章の意味を理解し、もっともらしい画像を生成することができます。

DALL-E公式サイト

https://openai.com/blog/dall-e/

日本のSNS上では、「DALL・E」について、「すげー!」「とんでもない」「早く使いたい」など、技術を絶賛する声が多く見受けられる。この記事では、同技術で生み出されたイラストや写真を紹介したい。

鏡に映ったサングラスを見つめるピカチュウ

チュチュを着て犬を散歩させる大根の赤ちゃん

アボカドのような形をした椅子

キリンを模したカメ

DALL-Eの現在

2021年10月現在、「DALL-E」の深層学習モデルは一般交換されておりません。

そのためOpenAIの論文を元に、「DALL-E」の複製実装に取り組んでるものがあります。

その中で現在最も進んでいるのが、「DALL-E in Pytorch」になります。

DALLE-pytorch

https://github.com/lucidrains/DALLE-pytorch

また、DALL-E in Pytorchの副産物として興味深い物として「Bigsleep」と「DeepDaze」があります。

どちらもテキストからアーティスティックな画像を生成するモデルです。

BigSleep

https://github.com/lucidrains/big-sleep

artificial intelligence

cosmic love and attention

fire in the sky

the tragic intimacy of the eternal conversation with oneself

demon fire

DeepDaze

https://github.com/lucidrains/deep-daze

cosmic love and attention

a time traveler in the crowd

life during the plague

 

どうでしょうか?

AIの最先端フレームワークによって近代的な芸術が出来たと思いませんか。

あなたが気に入った画像はあったでしょうか。

今後のAIによる創作には注目です。

Ryuda
DALL-Eディープラーニング