【Stable Diffusion】画像生成AIに挑戦 – Manabu Hagiwara, 萩原学, on manau.jp

人工知能（AI）ブームが発展してます。
生成系AIなるものが、世の中を変え始めました。
いえ、すでに変わったのかも知れません。

対話系の生成AI「ChatGPT」の技術は、
数十年後もしくは数年後には、
現在のスマホくらい普及するでしょう。

萩原が注目しているのは画像生成AIです。
そのうちの１つ Stable Diffusion を使用し始めました。

Stable Diffusion は text-to-image モデルと呼ばれるジャンルのシステムの１つ。

「犬」と文字（text）で入力すると、犬の画像（image）を描いてくれます。
「火星を歩く犬」と入力したら、犬が火星を歩いている画像を描いてくれます。
写真と見間違うようなクオリティにもできるし、マンガっぽいタッチにもできます。
写真のようにしたければ
「写真, 火星を歩く犬」のように、作りたい画像を説明するキーワードを羅列するだけでOKです。

Stable Diffusionを使うメジャーな方法は３通り。
１．「Stable Diffusion Online」というウェブサイトにブラウザでアクセスして、ブラウザ上でサービスを利用。
２．Stable Diffusionのファイルをダウンロードして、パソコンにインストール。
３．Google Colab上にインストールして利用。

一番お手軽は１番目。お試しするだけでビックリすると思います。
もしも２．が可能であれば、自宅のパソコンなどにインストールして、好きな画像を好きなだけ作ったりして楽しめます。でも、GPUと呼ばれる処理装置が無いパソコンだと、画像生成時間がべらぼうにかかります。GPUがあれば１分で造れる画像も、ない場合は１５分など。（実体験）
Google Colabを使う３．であればGoogleのGPUを利用できるので、２．を仮想的に実現できます。ただし、GPU利用によってColabの料金が発生します。

Stable　Diffusionを使う時に入力する文字列（例：写真, 火星を歩く犬）は「prompt（プロンプト）」とか「呪文」と呼ばれます。
promptを工夫することで、好きな画像を作れるようになります。逆に、うまく工夫できないと、満足できない画像が生成されることも。

説明はこのくらいにして、Stable Diffusionを使って、実際に僕が作った画像をお見せしますね。