Stable DiffusionのWEBUIの使い方
Stable Diffusionのユーザインタフェースでもっともメジャーなのが、Automatic1111。ブラウザから操作できるのでクセがないのが特徴。
とりあえず、インストールから、モデル入れて使えるようにするまでをざっくり解説してみたい。
Automatic1111のインストール
Automatic1111は、GoogleのCorabo環境(実験用のプログラム実行環境。ウェブからある程度無料で利用できる)のユーザインタフェースとしても使える。
が、ここでは自分のパソコンのWindows11上で動かす前提でインストールしていきたい。
まずは、ファイルをダウンロードする。
>Tags · AUTOMATIC1111/stable-diffusion-webui · GitHub (50MBくらい。Automatic1111のダウンロード)
以下の画面が開くので「zip」というちっちゃい文字をクリック。
なお、この「Tags」というページは、今後今後バージョンがあがっていくとページが増えていくので、最新バージョンのzipをダウンロードしよう。2023年3月時点では、v1.0.0-preが最新だった。
ここでダウンロードできるzipファイルは、Windows10用に作られてて、こんなふうに書かれてた。
webui.zip は、python と git をインストールできない人向けのバイナリ ディストリビューションです。
すべてが含まれています – run.bat をダブルクリックして起動するだけです。
Windows 10 以外の要件はありません。NVIDIA のみ必要。
一度実行した後、インストールを別のコンピューターにコピーして、オフラインで起動できるはずです。
展開先は、パス名に日本語が含まれていない場所が無難だ。
私はd:\stablediffusionというフォルダを作って、そこに展開した。
すべてが含まれています、とはいうものの、画像生成のコアとなる「モデル」は含まれていない。ダウンロードしてこよう。
Automatic1111にモデルをダウンロード
モデルというのは、AIが学習結果を1ファイルに保存したもので、画像生成のコアになるものだ。
モデルファイルのサイズはデカくて、7G~10Gくらいはある。まあ最近は、内蔵ハードディスクも大容量になってきているので、新しいパソコンなら気にならないかな。私も使うわけねーよと思ったけど、4TBのハードディスクつけといて良かった。
StableDiffusion用のモデルは色々あるけど、私が普段使っている2つのモデルを紹介しよう。
なお、モデルのダウンロードには「Hugging Face」というサイトへの登録が必要になる。このサイトは、AIのモデルをクラウド上で実行したり学習させたりできるサービスを提供している。画像生成以外にもさまざまなモデルがアップロードされているのだ。まあ、一応怪しいサイトじゃないので安心してほしい。
Pricingがどうこう書いてあって、お金取られんのかと身構えるかもしれないが、モデルをダウンロードするだけなら無料だ。
Abyss Orange Mix
こちらは、アニメ・イラスト調で描いてくれるモデル。
▲「beautiful girl, tokyo street」で生成
ページを開くとどれダウンロードすればいいの?って迷う。
>WarriorMama777/OrangeMixs at main (Abyss Orange Mix 2ダウンロードページ)
4種の違いは上の通り。激エロなやつは、プロンプトに反応してすぐエロ画像になる。たぶん。
拡張子が「safetensors」「ckpt」というのはファイル形式の違いで、どちらも使える。いちおう「safetensors」拡張子のほうが、変な情報を混入させにくい分安心、ということになっているらしい。
私は当時そんなの知らなかったので、ckptの方をダウンロードしてしまった。
モデルは、webuiの展開フォルダの「sd.webui\webui\models\stable-diffusion」以下に保存しよう。
basil mix
こちらは、basil mix。アジア系&実写系をうまく描いてくれるモデル。(一般のモデルは、外国人をたくさん学習しているため、日本人の顔はなんか変になってしまう…)
▲「beautiful girl, tokyo street」で生成
>basil mix.ckpt · nuigurumi/basil_mix at main (basil mixの直ダウンロードページ)
クリックすると以下の画面がでるので「download」のちっちゃい文字をクリックする。
なんでdownloadの文字ちっちゃくすんだよ…。
サイズは7.7GB。ハードディスクの容量を空けてのぞもう。
さらに、basil mixは「VAE」という別ファイルが必要になる。なんだよバエって。私の理解では、VAEというのは、特定分野を強化するための補助ファイル…だと思う。
以下のファイルを指定すると、「人間の顔生成」が向上するっぽい。basil mixではこのvaeファイルを指定することが推奨となっているのだ。
stabilityai/sd-vae-ft-mse-original at main(ダウンロードページ)
ダウンロードしたら、モデルと同じフォルダに「basil mix.vae.pt」にリネームしておいておこう。
このリネームして置いておく、というのが最新のやり方なのかどうかは不明。でもいちおう動いてる。
Automatic1111の基本的な使い方
これで準備は整った。いちおう動作テスト的に動かしてみよう。
Automatic1111をzip解凍したフォルダで、run.batをダブクリして実行する。
run.bat実行後は、それなりに時間がかかる。Dos窓が開いてなにやらファイルチェックっぽいことと必要ファイルやモデルのロードなどを始める。
で、「Running on local URL」のとこに出てる「http://127.0.0.1:…」をCtrl押しながらクリックするとブラウザ画面が勝手に開く。(URLの末尾の数字は起動ごとに変わるので、ブックマークしてもだめだ)
開いた画面の「Prompt…」と書いてある欄に適当な指示ワードを入れて、Generateをクリックで画像生成される。簡単だ。
が…、出てきたのはなんかぼやけた画像…?
最低限「Smpling steps」は50くらい、CFG Scaleは12くらいにしておこう。私はパラメータの意味ははっきりわかってないけど、経験則的にここの数値を上げると画質が向上する。
くっきりした。
なお、生成ごとに違う画像が出てきてしまうので、「さっきの画像をSampling Steps変えて再生成したい!」という場合は、seedという値を固定すれば可能だ。seedは生成画像に書き込まれているので、メモるのを忘れちゃっても大丈夫。
Automatic1111の生成画像から、Seed値を知る方法
「PNG Info」というタブをクリックして、生成画像をドラッグ&ドロップすると、右側に生成時のプロンプトと「Seed:…」という情報が出てくる。これをコピーして使う。
txt2imgタブに戻して、プロンプトとSeedをコピペ。パラメータを好きにいじって、GenerateをクリックすればOKだ。
Stable DiffusionのWebUIのまとめ
- StableDiffusionの有名なウェブインタフェースは、Automatic1111
- Automatic1111は、簡単インストール。モデルだけ別途ダウンロードして入れる
- インストールフォルダのrun.bat実行後、メッセージ中のURLをCtrl+クリックで画面が開く