今回も無料の画像生成AI「Stable Diffusion」に関する話題で、タイトルの通り
を具体的かつ丁寧にご紹介するという内容になっています。
AIによる美少女イラスト生成ではプロンプト(=呪文)がイラストのクオリティを大きく左右するのですが、適当に呪文を唱えようものなら「なんかコレジャナイ」感たっぷりのイラストが生成されてしまいます。なので初心者の方からしたら
と疑問に思ってしまいますよね。
そこでここではStable Diffusionで10000枚以上のイラストを生成してきた私が、ハイクオリティな美少女イラストを効率よく作るための呪文のコツを解説していきますね。
サンプルイラストを最新のモデルを使ったものに変更しました。
Stable Diffusionで美少女イラストを生成するための下準備
まずはじめに、今回ご紹介する呪文のコツを使うためには前提として
- 無料の画像生成AI「Stable Diffusion」を使うための環境を構築しておく
- アニメ風の美少女イラストを生成できるように調整しておく
といった作業が必要になります。この辺の作業については下記の2つの記事でそれぞれ丁寧に解説していますので、「まだ美少女イラストを生成したことがないよ」という方は先にそちらをご覧いただければと思います。
美少女イラストの生成例(呪文のサンプルつき)
ではここからが本題です。まずは私が生成した美少女イラストの具体例をご覧ください。また、呪文の具体例も公開しているので参考になさってください(ここにキーワードを羅列すると検索上よくないので、呪文の例はGoogleドライブに置いてあります)。
【生成条件】
- モデル:Counterfeit V3.0
- サンプラー:DDIM
- サンプリングステップ数:25
- Hires.fixを使用し、512px四方→1024px四方にアップスケール
クリスタルのお姫様
氷のお姫様
猫耳美少女
赤い月と深紅の美少女
神絵師のようなイラストを生成するための呪文のコツ・具体例
さて、それではここから上記のような美麗イラストを生成するための呪文のコツを解説していきます。コツと言っても書きだすと少々長くなってしまいますので、順を追って説明しますね。
- 画像生成AIの得意・不得意を知る
- 「ネガティブプロンプト」を使いこなす
- 呪文は簡潔かつ具体的に書く
それぞれ詳しく見ていきましょう。
まず「画像生成AIの得意・不得意」を知る
まずは呪文がどうの…という前に、良い呪文を唱えるためにはAIの得意・不得意をきちんと知っておく必要があるのでその部分からご説明します。
AIが得意な部分
まずはAIが得意な部分です。学習モデルにもよりますが、美少女イラスト用に訓練されたモデルであれば下記はほぼ完璧に描くことができます。
- 顔や瞳
- 衣装(特にドレスや制服)
- 髪の毛
- 太ももから上の全体像
- 空や森などの風景
したがって上記のような部分を強調するような呪文をなるべく具体的に唱えるとよいでしょう。
AIが不得意な部分
逆にAIが不得意な部分は次のとおりです。
- 指(←すごく苦手)
- 画面全体を細かく丁寧に描くこと
とにかくAIは指を描くのが苦手で、形が変になったり本数がおかしくなることがほとんどです。何のテクニックも使わなければ指を違和感なく描ける確率は10分の1かそれ未満だと思います(※ただし今はControlNet等があるので、そういった技術を活用すれば正確さはもっと上がります)。
またそのほか、画面の色々な部分を欲張って強調するような呪文を唱えると逆に全体がパッとしない仕上がりになることが多いです。したがって呪文を唱える際はどこを強調するのかを絞ったほうがいいと思います。
「ネガティブプロンプト」をしっかり指定し、悪い結果を未然に防ぐ
お次はメインの呪文…と言いたいところですが、その前に「ネガティブプロンプト」がクオリティの高いイラストを生成するために必須となるのでそのコツを説明します。
そもそもネガティブプロンプトとは?
まずネガティブプロンプトとは生成結果に含めたくない要素を指定するためのプロンプトです。
普通のプロンプトだけだと指定範囲が広すぎて低品質な要素が生成結果に入ってしまうことがほとんどなのですが、ネガティブプロンプトを使えばそういった要素を予め排除することができ、望ましい結果だけを得ることが可能です。
初心者の方で「なんかイマイチなイラストしか生成されないなぁ」とお悩みの方の多くはネガティブプロンプトをきちんと指定していないはずです。なので少し面倒ですが必ず毎回指定するようにしましょう。
美麗イラストを作るために必須のネガティブプロンプト
とはいえ、具体的にどんなネガティブプロンプトを指定すればよいのかがよく分からないと思いますので、必須のキーワードを2つご紹介します。それは
です。この2つのキーワードの要素を除外することで、複雑で美しい塗りのイラストが生成される確率が大幅にアップします。
…ただしこの2つのキーワードは画風によっては除外しないほうがいい場合もありますので、その辺は上手く考えて調整してください。あくまでも先ほどのサンプルイラストのような画風の場合は上記をネガティブプロンプトとして指定してくださいということです。
例えば描き込みが少ないフラットなイラストにしたい場合は、上記2つのキーワードをネガティブプロンプトではなくプロンプトの方に盛り込むといいかもしれません。
その他、悪い結果を防ぐためのネガティブプロンプトの例
また、そのほか悪い結果を防ぐためにネガティブプロンプトとして指定したほうがいいキーワードも色々とあります。例えば
- 指や体の変形を軽減させるためのもの(※ただし効果はおまじない程度):
bad fingers, bad anatomy, missing fingers - 余計な文字などが入らないようにするためのもの:
signature, watermark, username, artist name - 全体的に低品質なイラストになるのを防ぐもの:
retro style, poor quality, worst quality - 服を着ない女の子になってしまうのを防ぐもの:
nsfw(※職場閲覧注意、という意味のキーワード)
等があります。必要に応じて追加してください。
呪文は簡潔かつ具体的に書く
さて最後になりますがようやくメインの呪文のコツです。そのコツは一言でいえば
これに尽きます。ネットで公開されている呪文のサンプルを見ると、手当たり次第にキーワードを羅列しているものをよく見かけますがそれだと毎回唱えるのが面倒ですし、どのキーワードがどう影響しているのかも分かりづらいです。なので呪文はシンプルに記述することを心がけましょう。
より具体的には、美麗なイラストを生成するためには面倒でも下記の要素を一つ一つ丁寧に指定したほうがいいです。
- イラストであることを明記する
- どんなキャラクターか
- 顔立ちや目はどんな感じか
- 髪型はどんな感じか
- 何を着ているか
- 被写体は何人か
- どんなアングルで描くか
- 被写体をどこまで映すか
- 背景に何を描くか
- ライティングはどうするか
- 色調は何色がメインか
一見すると色々な要素を指定しなければならないようで面倒くさそうですが、必要なキーワードはほとんどが1個ずつなので呪文の長さはコンパクトにまとまるはずです。
ではそれぞれザックリと見ていきましょう。
イラストであることを明記する
まずはこれから生成する画像が写真ではなく「イラスト」であることをきちんと明記しておくのがいいです。しかも高品質なイラストなので、
などと書いておくとよいでしょう。
どんなキャラクターか
次は被写体がどんなキャラクターなのかを簡潔に書きます。かわいい女の子のキャラクターであれば、基本形は
というような感じでOKです。ただしこれだと少しざっくりしすぎているので、例えば
- 猫耳少女:girl→girl with cat ears
- メイドさん:girl→maid
といった具合により具体的になるように変更してください。逆にあまりにも具体的すぎてもAIが困ってしまうかもしれないので上記くらいの粒度が丁度いいと思います。
顔立ちや目はどんな感じか
お次は顔や目の指定です。この辺はイラストの中で最も重要になるので
といった一文を加えて美しい顔や瞳を描くことを強調してあげると上手くいく可能性が高くなります。なお、もし瞳の色が決まっているようであればそれを書き加えておきましょう。
髪型はどんな感じか
それから美少女イラストの場合は髪も重要になるため
というキーワードを基本形にして、ロングヘアやショートヘア、ポニーテール等の髪型を指定すると好みのキャラクターになりやすいです。髪の色も決まっていれば書いておきましょう。
何を着ているか
衣装については、先ほども書いた通りドレスや制服だとかなりうまく描いてくれます。特にドレスの場合はフリルなども非常に精細に描いてくれるので
などと指定しておけば、フリルがたくさんついた美しいドレスを描いてくれる確率が高くなります。こちらも色が決まっていたら指定しておきましょう。
被写体は何人か
次に被写体に関しては基本的には1人だけ描くのがベストです。特にこだわりがなければ
などと指定しておくのがいいと思います。…ただし、これらのキーワードを書いておいてもなぜか2人以上のキャラクターが描画されることもあります。
どんなアングルで描くか
イラストにおいてはアングルも重要で、何も指定しないと肖像画のように動きが感じられないイラストばかりになってしまうことがあります。そこで
と書いておくとよりダイナミックな構図のイラストを生成してもらえる確率が高まります。
被写体をどこまで映すか
さてAIにイラストを頼む場合は、被写体をどこまで映すかの指定がかなり重要になります。というのは、例えば
- 胸から上だけの肖像画にする場合:
AIは顔を非常に美しく精細に描いてくれるが、背景はほぼ抽象的になるのでイラスト的には少し物足りなくなる - 全身+背景を含めたイラストにする場合:
AIは背景をかなりうまく描いてくれるが、今度はその代わりキャラクターの顔が適当になってしまったり、指が変に描かれたイラストになってしまったりする
という感じにトレードオフになるからです。この辺をどうするかは皆さんの好みや欲しいイラストによると思うのですが、個人的なオススメは「太ももから上を映したショット」を表す
というキーワードを指定することです。こうすればキャラクターと背景のバランスを上手くとって描画してくれることが多くなるので私は重宝しています。
ただしお使いのモデルによっては「cowboy」というキーワードに反応してカウボーイ風の女の子が出てきてしまうこともあります。そのような場合は普通に「upper body」などと指定するようにしましょう。
背景に何を描くか
次に、できれば背景に何を描くかも指定しておきましょう。例えば背景に森を描きたい場合は
などとザックリでもいいので指定するとかなりうまく描いてくれます。この辺はAIの得意分野なのである程度はおまかせでも大丈夫です。ただし本当にクオリティの高いイラストを決め打ちで生成したい場合はなるべく具体的に風景を指定しましょう。
ライティング(照明)はどうするか
美しいイラストを描くためにはライティング(=照明)も非常に重要です。何も指定しないとちょっと明るさが足りない感じになりがちなので、例えば明るいイラストにしたいなら
などと書くと真昼の太陽を光源にしたようなイラストに仕上がります。一方、柔らかい光にしたければ「soft lighting」などと書くとよいかもしれません。
また、例えば夕焼けなどの場面では被写体を逆光で映すと目を引くイラストになる場合もあるのでその辺は上手く工夫してください。
色調は何色がメインか
最後はイラストの色調です。指定しないとその他の要素からAIが色調をくみ取って調整してくれるのですが、例えば青系のイラストにしたいという希望があれば
などと指定すればその通りのイラストに仕上がります。
おわりに
以上、少し長くなってしまいましたがStable Diffusionで神イラストを生成するための呪文のコツをご紹介しました。
AIによるイラストはまだまだ弱点はあるものの、うまく使いこなせば神絵師にも負けない美麗イラストを生成することができると思います。ぜひ上記の内容を参考にしていただき、思わずうっとりするようなイラストを作って頂ければと思います。
この記事が美少女イラスト生成の参考になれば幸いです。