生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載第四回は、番外編として待望の高画質画像生成AI「SDXL 1.0」リリース速報をお伝えします(編集部)
SDXL 1.0をAUTOMATIC1111で動かすには
Stability AIが画像生成AIのStable Diffusion 1.5をリリースしたのは2022年10月20日。そこから約9ヶ月経った本日2023年7月27日、高画質な最新バージョンSDXL 1.0の登場となった。まだ全く使いこなせていないが、速報と言うことで、その絵をご覧頂きたい。
Stable Diffusion 1.5とSDXL 1.0の大きな違いはザックリ2点。
学習ベースが512✕512ドットから1,024✕1,024ドットへ
1pass式からBase→Refinerと言う2pass式になった
学習ベースの解像度がこれだけ違うと、当然出てくる絵に差が出る。1passから2passになった技術的な理由はさておき、Baseのままでもそれなりに見れ、更にRefinerを通すと解像度や質感が向上する。
※出典:stabilityai/stable-diffusion-xl-base-1.0
それでは早速、Stable Diffusion Web UI / AUTOMATIC1111での使い方を説明したい。まず、AUTOMATIC1111を最新版の1.5.0へUpdateする。今、新規インストールなら元からこれが入るので心配無用だ。ちなみに既に1.5.1のRCがあったりする。
手順はいつもの新しいCheckpointインストールとほぼ同じ。2本のCheckpointと、1本のVAEを所定の位置にコピーすればOK。ダウンロード先は以下の通り。
これで準備は完了。後はWeb UI上でCheckpointにsd_xl_base_1.0、VAEにsdxl_vaeを選択。以降t2iの設定はほぼ同じだ。
違うのは解像度。512✕512ドットではなく1,024✕1,024ドットにする。試したところSampling stepsは20~、CFG Scaleは5~だろうか。Restore facesはOFFに。そしてNegative Promptはできるだけシンプルに…。
これで絵は出ると思うが、実は現在、AUTOMATIC1111 v1.5.0はRefinerに対応していない。何とかする手は、
t2iで作った画像をi2iへ転送
Checkpointをstable-diffusion-xl-refiner-1.0へ切り替え
Sampling stepsは20~、CFG Scaleは5~。Restore facesはOFF、そしてDenoising strengthを0.1~0.3(お好みで)とし、Upscaleは行わない
これで完成した絵が本来のSDXL 1.0の姿となる(何分速報なので間違っていたらお許しを)。Checkpointの切り替えが入り手間だが現状仕方ない。なおUpscaleする場合は、この後、SD Upscaleなどを使うことになる。
Base+Refinerを使ったSDXL 1.0の作例
では、このパターンで作ったSDXL 1.0を7枚並べたのでご覧頂きたい。最後8枚目は7枚目と同じ呪文/設定のSD 1.5純正Checkpoint版だ。なを今回はSDXL 1.0の作例と言うことで、後処理も含め特別なことはせず、出たままを掲載している。予めご了承頂きたい。
如何だろうか。もともと純正のCheckpointは汎用版なので、何が得意と言うわけではないが、全部結構それなりにこなしているのが分かる。
人に関しては7枚目(SDXL 1.0)と8枚目(SD 1.5)を見ればその差歴然。そのSD 1.5でさえ学習した専用Checkpointがあると、現在筆者が連載している通りかなりリアルになる。
そう考えれば、素のSDXL 1.0の絵がこれだと、用途に応じて学習した専用のCheckpointがどこまでリアルになるか想像もつかない。おそらくこれから色々Checkpointが出ると思うが、今から非常に楽しみにしている。
DreamShaper XL1.0 Alpha2を使った作例
実は既にSDXL 1.0用のCheckpointがcivitaiにいくつか上がっている。その中でリアル系だとこのDreamShaper XL1.0 Alpha2となる。確か昨日まではSDXL 0.9対応のAlpha1だったはずだが、素早い対応で驚いている。
ご覧の通り純正のCheckpointより、結構良くなっているのが分かる。が、まだAlpha2なので完成版ではもっと凄い絵が出そうだ。昨日までのAlpha1と比較しても随分良くなってる。
以上、速報と言う事でザックリ使い方と、その絵をご紹介した。以降、詳しい情報は筆者の連載などでお伝えしたい。