生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)

テクノロジー AI
西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)

グラビアカメラマンでエンジニアの西川和久氏による生成AIグラビア連載、今回は画像生成モデルStable Diffusion を使う定番インターフェースのひとつ Automatic1111の新バージョン解説と、プロンプトから高速に画像を検索できるエクステンションSearchMyPNGの使い方について。


生成AIグラビアをグラビアカメラマンが作るとどうなる?連載記事一覧はこちら


4月13日にv1.9.0リリース!現在v1.9.3へ

AUTOMATIC 1111は、v 1.8.0を軽く確認した以降、AUTOMATIC1111 Forgeばかり使っていて、ご無沙汰だったのだが、4月13日、Xのタイムラインにv1.9.0の文字が流れてきた。これは!とアップデートの内容を確認すると、主な部分は以下の通り。

  1. メインUIにSchedulerの項目を追加

  2. SDXL-Lightningモデル用にSgm uniform scheduler追加

  3. コールバックを並べ替えるためのUIを追加

ご覧の様に意外と少ない(もちろんパフォーマンス向上や細かい修正なども含まれる)。ただ1の「メインUIにSchedulerの項目を追加」は非常に大きい改良だ。

以前この連載でも指摘していたが、AUTOMATIC1111のSampling methodは、SamplerSchedulerを一つにまとめており、例えば

DPM++ 2M SDE Karras

という表記に。ところがComfyUIなど他のアプリだと

DPM++ 2M SDE / Karras

と、二つに分けて表示しているのだ。Stable Diffusion的には後者が正解

1の表記方法で困るのは、例えば、Euler。これは本来、Sampler eulerで、Schedulerは何か設定されているはずなのだが、これだと何か分からない。

加えて去年(2023年)後半以降、SchedulerにLCMやTurboなど、いろいろなものが出てきてしまい、従来の方法で全部に対応しようとすると、1つのSamplerに対してSchedulerの種類分、一覧の中が増えることになる。

実際ずらっと並んだ一覧を見ると、何が何だか…と分からなかった人も多かったのではないだろうか。

従来のSampling method(Forge)。いろいろずらっと並び、選ぶだけでも面倒
SamplerとSchedulerに分かれ、sgm_uniformを追加

おそらくAUTOMATIC1111が前者のようになっていたのは、初期の頃、SamplerとSchedulerの種類が少なく、であればまとめて一つの項目にした方がいいよね!的な発想だったのだろう。

これを本来のSamplerとSchedulerに項目を分けることでスッキリさせたのがv1.9系の大きな変更部分となる。

Schedulerに関してはもう一つ、2のsgm_uniformが追加された(ForgeにはDPM++ 2M SDE SGMUniformがある)。これはSDXL-Lightningモデル用だ。

そして3は、Extensionsなどを読み込む時、順番の並び替えに対応した。Settings[Show all pages]、 Webブラウザのページ内検索にcallbackと入れれば、該当部分が見つかる。

通常、触る必要が無いと思うが、例えばExtensions同士の食い合わせで、うまく動かなくなった時に、このロードする順番を並び替えてうまく行くケースがあるかも知れない。

Settingsのcallback関連

パフォーマンスに関しては、詳しく比較したわけでは無いものの、Forgeの方が生成速度、リソースの消費量共にまだ優れている様だ。

AUTOMATIC1111 vs Forge。上記の優位性はもちろんだが、個人的にはModelの切り替え時、かかる時間がかなり違うのが、使っている理由として大きい。

と言うのも、同じPrompt/設定でModelを切り替えての結果比較や、xyzプロットでModel比較などを行うと時間が大幅に変わる。関係ない人には関係ないものの、筆者的には結構重要だったりする。

ところで、v1.9.0のSamplerとSchedulerを分けた部分、Forgeでも直ぐ追従すると思ったが、2週間経ってもいっこうに動きがない。Fooocusもかなりの時間放置。作者のlllyasviel氏、Xでも最近書き込みが無く、忙しいのか何かあったのか…。

話が逸れてしまったが、以降、ちょっとした機能追加やBUG修正が行われ、執筆時点で v1.9.3になっている。

v1.8.0からのUpdateは、git cloneでインストールしたケースだと、git pullで自動的に更新され、特に難しいことはない。もちろん環境もそのまま引き継がれる。

Promptのキーワードで生成した画像をサクッと検索できる便利なSearchMyPNG

筆者は普段、AUTOMATIC1111で生成した画像を参照するときは”Infinite image browsing”を使っている。表示速度が速く、Promptの確認、Promptをtxt2imgへ転送などができたり非常に便利だ。

Prompt内容による検索機能もあるが、(重量級で)設定項目がそれなりにあり、サクッと探したいときには少し面倒だったりする。

こんな場合は検索に特化した”SearchMyPNG”が便利。初回[Create Database]ボタン、更新時は[Update Database]ボタンを押す必要があるものの、あとはSearch wordに探したい画像のキーワードを入れ[Search]ボタンでOK。

SearchMyPNG

txt2imgへPromptを送る機能は無いが、画像を一旦ダウンロードして、PNG Infoで情報を送ればいいので、(一手間かかるが)特に問題ではない。

インストール方法はExtensions > Install from URLでGitHubのURLを入れ、[Install]。AUTOMATIC1111を再起動すれば上のタブにSearchMyPNGが増えている。関連するModelやファイルなどをインストールする必要もなく確実に作動する。生成した画像が溜まってきたら使いたいツールの一つだ。

今回締めのグラビア

最近筆者が好んで使っているSampler設定は、DPM++ 2M SDE, SGM Uniform, Steps 25, CFG scale 4.5

FooocusやComfyUIでも同様。もちろんModelによって微調整でStepsやCFG scaleは変わる事もある。

一般的にSchedulerはKarrasだと思うが、少し癖があるのとコントラストが高め(の様な気がする)。と言うことで、せっかくAUTOMATIC1111 v1.9系にSGM Uniformが追加されたので、それを使って作ったのが以下のグラビアだ。

本来SDXL-Lightningモデル用だが、普通のModelでもいい感じに出るため構わず使っている(笑)。

DPM++ 2M SDE, SGM Uniformでのグラビア!
1
2
  1. 同じ設定でDPM++ 2M SDE / Karras

  2. Euler / Karras。但しSteps 50, CFG scale 7。どちらも指がおかしいが、比較のためそのまま掲載している

もう一つのお気に入りは、Euler, Karras。ただこのパターンはStepsとCFG scaleが大きめで50, 7となる。SamplerにDPM++ 2M SDEを使うとくどい感じになりがちなので、あっさりした絵にしたい時はこの設定がお勧め。扉の写真はこちらのパターン。GWなので旅行中の駅っぽくしてみた。

AUTOMATIC1111 v1.9系はSamplerとSchedulerの組み合わせが出来るようになったので(ダメなのもあるが)、いろいろ試してほしい。



編集部より:テクノエッジでは西川氏を講師に迎え、ライブで画像生成を試しつつ直接質問もできる『グラビアカメラマンが教える、生成AIグラビア実践ワークショップ』をオンラインで定期的に開催しています。

クラウドサービスを使うため、高性能なPCやGPUは不要。受講料にはクラウドサービスの利用料も含みます。


テクノエッジの会員制コミュニティ『テクノエッジ アルファ』加入者のかたは、生成AIグラビアワークショップを含めオンラインイベントに無料で参加でき、アーカイブも視聴いただけます。


《西川和久》

西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

BECOME A MEMBER

テクノエッジ友の会に登録しませんか?

今週の記事をまとめてチェックできるニュースレターを配信中。会員限定の独自コンテンツのほか、イベント案内なども優先的にお届けします。