今回は画像生成AIの入門的な話題で、
を一通りまとめてご紹介するという内容になっています。
普段ネットをご覧の方であれば、AIが自動生成した美麗な画像を見かけたことがあるかと思います。なので画像生成AIに興味をお持ちの方も多いと思うのですが、正直なところ
とお悩みの方がほとんどなのではないでしょうか。
そこでここでは、AIで画像を3000枚以上生成してきた私が
- そもそも画像生成AIとは?
- 完全無料で使えるStable Diffusionについて
- 一番簡単なインストール方法
- 基本的な使い方
といった点について丁寧に解説していきますね。
そもそも画像生成AIとは?
でははじめに「そもそも画像生成AIって何だよ」という方もいらっしゃるかもしれないので、その部分からザックリと説明しようと思います。
画像生成AIとは、とてつもない量の画像を元に学習を行った人工知能のことで、「プロンプト」(俗にいう「呪文」)とよばれる英単語や英文を打ち込むことでそれに合った画像を生成してくれます。例えば
(お金と金塊に囲まれたくろくま)
という呪文を打ち込むと次のような画像が生成されます。
…結構リアルでしょ?これは写真のような出来栄えですが、画風を表す英単語を呪文に混ぜることでイラスト風にもできます。
このように呪文次第で色々と面白い画像を生成することが可能です。
完全無料で使える画像生成AI「Stable Diffusion」
そんな画像生成AIにはいくつか種類があるのですが、完全無料で使えるのは今のところオープンソースの「Stable Diffusion」というAIになります。そこで下記の内容ではこのStable Diffusionを使った方法について解説していきます。
Stable Diffusionを使うための3つの方法と、それらの比較
まずStable Diffusionを使うには主に次の3つの方法があります。
- Stable Diffusionを採用したWebサービスを使う方法
- クラウド環境にインストールして使う方法
- 自分のパソコンにインストールして使う方法
Stable Diffusionを採用したサービスを使う方法
一つ目は、Stable Diffusionを採用したWebサービスを使って画像を生成する方法です。メリットとしては高性能なPCを持っていなくても画像を生成できますし最新バージョンのAIを手軽に使える点が挙げられますが、基本的に有料で提供されるサービスばかりなのでお金がかかるのがデメリットとなります。また、例えば大人向けの画像などは制約がかかっていて生成できません。
クラウド環境にインストールして使う方法
次に二つ目はクラウド環境にStable Diffusionをインストールする方法です。こちらも高性能なPCを持っていなくてもできるのが魅力です。しかしクラウド環境は使えば使うほど料金が発生するようになっているため、大量の画像を生成しようとするとやはりお金がかかってしまいます。
自分のパソコンにインストールして使う方法(おすすめ)
三つ目は自分のパソコンにStable Diffusionをインストールする方法です。上記二つとは違って比較的高性能なPC(※特にグラフィックボードの性能)が必要になりますが、好きなだけ画像を生成できるうえに制約もないので自由度としては最も高くなります。
個人的にはこの方法が一番オススメなので、下記ではローカル環境にインストールする方法をご紹介しますね。
Stable Diffusionの一番簡単なインストール方法
さて前置きが非常に長くなってしまいましたがここからが本題です。まずはStable Diffusionの一番簡単なローカル環境へのインストール方法をご説明します。
ローカル環境にインストールする場合に必要なPCスペック等について
まずはお使いのPCのスペックに関する注意点です。Stable Diffusionをローカル環境にインストールする方法ではそこそこのPCスペックが必要となります。特に性能が必要になるのがグラフィックボードで
- NVIDIAの「RTX20」シリーズ以降
- かつ、VRAM(=ビデオメモリ)が6GB以上
であることが推奨されています(※グラボが古かったり、性能が足りなかったりすると画像が出力されません)。
一番手軽に使える「Stable Diffusion GUI」のインストール手順
ではStable Diffusionの具体的なインストール方法についてご説明していきます(※ここでご紹介するのはWindows限定なので予めご了承ください)。
Stable Diffusionは自力で環境を構築してからインストールしてもよいのですが、大変ありがたいことにGUIを使って簡単にインストール&使用できる「NMKD Stable Diffusion GUI」というソフトが無料で配布されているのでそれを活用させて頂きましょう。
ダウンロード&展開
まず下記サイト(ゲーム開発者の方にはおなじみのitch.ioというサイトです)からNMKD Stable Diffusion GUIの圧縮ファイルをダウンロードしましょう。

ダウンロードしたら中身を好きなフォルダに展開します。展開すると巨大なファイルサイズになるのでストレージの空き容量に注意して下さい。また圧縮形式は「7z」であり解凍ソフトがないと展開できないと思います。展開にはかなり時間がかかります。
インストール
展開できたら、中にある「StableDiffusionGui.exe」を実行しましょう。すると初回起動時は次のようなインストールウィンドウが出てくるので「Install」ボタンを押します。
これで本来は面倒な環境構築作業を自動的に行ってくれます。ただし追加で数GBのデータをダウンロードすることになるので、お使いの環境にもよりますが時間がかかると思います。気長に待ちましょう。
Stable Diffusion GUIの基本的な使い方
お次はStable Diffusion GUIの基本的な使い方の紹介です。…といっても使い方はとても簡単で、画面左上のテキストボックスにプロンプト(=いわゆる呪文)と呼ばれる英単語や英文を打ち込み、右下の「Generate!」ボタンを押すだけです。プロンプトは長めの英文でもOKですし、カンマ区切りで英単語をずらずらと列挙することもできます。
これでわずか数秒で1枚の画像が生成されます。
ただしインストールしてから初めて生成するときは必要なデータをダウンロードするなどの処理が走るのでかなり待たされます。また、毎回起動した直後の生成も読み込み処理が走るらしく少し待たされるのでご注意ください。
ネガティブプロンプトについて
ところでStable Diffusion GUIの画面をよく見るとプロンプトの記入欄が2つありますが、上が通常のプロンプト・下がネガティブプロンプトの入力欄となっています。
ネガティブプロンプトとは、通常のプロンプトとは逆で「生成する画像に含んでほしくない要素」を指定するためのものです。基本的には空欄でも問題ないのですが、例えばアニメ風の美少女イラストを生成する場合はネガティブプロンプトが非常に重要になるので覚えておきましょう。
プロンプト(呪文)のコツ
さてStable Diffusionで多くの画像を生成していると、プロンプトの打ち込み方によって生成される画像のクオリティが全く違ってくることに気づくかもしれません。つまりプロンプトは適当に打つのではなく、特定のキーワードを盛り込むなどのコツが必要になってくるというわけです。
このプロンプトのコツについては下記の記事(外部リンク)が丁寧で詳しいのですが…

書き方としては基本的には英文というよりは単語をカンマ区切りでたくさん書くのがお手軽であり、欲しい絵面を的確に表現している英単語をなるべく多く盛り込むのがベストなようです。
ちなみにアニメ風のかわいい女の子のイラストを生成する場合はプロンプトだけでなく、他にもコツや調整が必要となります。その辺については他の記事で詳しくご紹介していますので、そちらも併せてご覧頂ければと思います。


生成する画像のサイズについて&画像をAIできれいに拡大する方法
最後に生成する画像のサイズについてですが、基本的には512pxにしておきましょう。執筆時点では最大で1024pxまでの画像を生成可能なのですが、解像度が高いほど生成に時間がかかってしまいますので512px程度が品質と生成速度のバランスを見たときに一番よい結果となります。
ただそのサイズだと画像の用途によっては解像度が小さすぎる場合もありますよね。そのようなときは画像拡大用のAIを使うときれいに高解像度化できます。
下記ページでReal-ESRGANという画像拡大AIの日本語GUI版を無料でダウンロードできるのでそれをインストールしてください。
そうしたら下の画像のように設定を行い「拡大開始」ボタンを押しましょう。
数秒で画像ががきれいに拡大されます。
おわりに
以上、Stable Diffusionのインストール方法から基本的な使い方までを一通りご紹介しました。
Stable Diffusionをローカル環境にインストールすれば好きな画像を無料でいくらでも生成できて便利ですし、ご紹介したソフトを使えば環境構築も難しくないので、ご興味があればぜひ導入にチャレンジしていただければと思います。
この記事が何かしら参考になれば幸いです。