気になるSDXL用ModelやLoRA
前回、連載11回目はSD 1.5用のModelとLoRAを主にご紹介した。
12回目の今回は予告どおり、次世代 Stable Diffusion として表現力が格段に向上した SDXL用のModelとLoRA、そして+αをご紹介したい。
Model
SDXL用のリアル系アジア(日本人)美女Modelとしては、こたじろう氏作のfuduki_mix、haduki_mix、nagatsuki_mix。そしてLoRAのayame_LoRAは、今や定番中の定番。サクッと日本人美女を出したい時はこれを選んでおけばまず間違いない。本連載で何度も登場していることもあり、改めて紹介する必要はないだろう。
これ以外で現在個人的にお気に入のSDXL用Modelはこれからご紹介する以下4つ(+4)となる。
筆者が何を基準で気に入るのかは、割と大雑把だが、まず直近で作ったそこそこ出来のいい画像の情報を読み込み、そのまま生成。一旦同じ画像が出てくる。
これを試したいModelに変えて生成。違和感無ければSeedを-1(ランダム)にして10枚前後生成。「行けるな!」っと思ったらModelファイルはそのまま残し、「あ、駄目だ」っと思ったら即削除している。そうしないとあっと言う間にストレージがいっぱいになるからだ。
「行けるな!」の基準は顔やバランスだったり色だったり肌の質感だったり…個人的な好みも入るので表現し辛いのだが、ザックリこんな感じだ。ただこれだけだと結構の数が溜まってしまうので、月に一回?同じ設定で手持ちの全Modelを生成、「もういいか!」的なものは削除している。
cherryPickerXL v2.7
https://civitai.com/models/125680?modelVersionId=173768photopediaXL Type 1
https://civitai.com/models/189109?modelVersionId=212406realisticStockPhoto v1.0
https://civitai.com/models/139565/realistic-stock-photoSoraAni25XL | Anime & 2.5D v1.0
https://civitai.com/models/186535/sora-ani25-xl-or-anime-and-25d?modelVersionId=209446
cherryPickerXL v2.7
cherryPickerXLは過去の連載でも作例として使っているが、10回目にご紹介したsd-scriptsを使った顔LoRAとも相性が良く、筆者が好きなModelの一つだ。
割と早い時期からあったModelで、SDXLで日本的なグラビアはまだ難しかった頃からそこそこ出たので、初期バージョンからの付き合いとなる。安定しているのはもちろん、このv2.7では肌の感じも随分良くなった。
photopediaXL Type 1
photopediaXLは、11月5日リリースと、ごく最近のModelで元々PhotoshopXLとして登場したが、流石に名前がまずかったのか?photopediaXLに変更となった。
またType 1とType 2があり、後者の方が少しアナログっぽい感じだ。個人的にはType 1の方が好みなので作例はType 1になっているものの、是非Type 2も試して欲しい。
直感的に「お!」っと思ったこともあり、現在色々テスト(遊び)中。今回、扉とグラビアはこのModelを使っている。
結構気に入っている事もあり、普段使うModelがcherryPickerXLからこれに変わる可能性が高い。ただ、っと言ってる間に他の何かが出るかも知れないが…。
realisticStockPhoto v1.0
上記2つのModelはMerge(色々なModelをブレンド)タイプだが、realisticStockPhotoはTrained(混ざりっけ無しの独自学習)タイプ。CFG Scale 3がベストポジションなど、他のModelと色々違って面白く、作例も顔の傾向が少し異なる。この様な特徴から少しテイストを変えたいときに使うケースが多い。
ただそのままだとアジア系はやや苦手。顔LoRAを当てる必要があるのだが、SDXL標準のbaseモデル(sd_xl_base_1.0.safetensors)を使ってのLoRAではなく、このModelを使って専用LoRAを作らないと効果が薄い。
後述するFooocusのrealisticプリセットに採用され、やはり筆者の勘は間違ってなかったようだ。
SoraAni25XL | Anime & 2.5D v1.0
SoraAni25XLは、3次元リアル系ばかり生成していると飽きてくるので(笑)たまに箸休めで使うModelだ。イラスト系も2.5次元系もどちらにも対応する。
リリースは11月2日。割と最近で、それまでこの用途では他のModelを使っていた。作例からも分かるように、何時も使うリアル系と顔の傾向が似ているので違和感も無い。
また一般的にイラスト系は、背景の描写やポーズ、アングルなど、リアル系より出やすい、つまり自由度が高い特徴がある。
この特徴を利用して、まずは好みのポーズやアングル等をこちらで生成してから、ControlNet / Depthで奥行き情報に変換し、そちらを元に今度は3次元リアル系Modelで再度生成することで、リアル系が苦手なポーズ、アングルなどをある意味力技で何とかすることも可能だ。
この他にも
といったModelも個性的だろうか。特に4番目は作者konapieces氏が日本人なので日本人美女もバッチリ♪
LoRA
LoRA (Low Rank Adaptation)とは、小さなサイズと計算量で効率的にファインチューニングする技法のこと。(参考:第六回:Stable Diffusionの基本2 / LoRAの概要と6つの例を紹介)
ここでは基本の Model と組み合わせることで、特定の効果を追加できる LoRA を紹介する。
ClearHandsXL
https://civitai.com/models/132884?modelVersionId=155932
AIが苦手な手指の表現を改善するLoRA。
上記の作例は全て同じPromptでSeedだけ変えている。何時も問題になる指に関してはClearHandsXLを使用。Promptへ<lora:ClearHand-V2:1>と入れるだけで、特にTrigger Wordなどはない。
変な指を完全に抑えられるわけではないものの、打率が高くなり、絵はいいのに指でボツ…を減らすことができる。但し過度な期待は禁物。
またUpscale時のDenoising strength値(追加書込度合い)によっては指がおかしくなるのは別の話となる(指だけでなく色々な部分が破綻するケースもある)。
woman laying on stomachその1
woman laying on stomachその2
東京駅 東海道・山陽新幹線ホームSDXLその1
東京駅 東海道・山陽新幹線ホームSDXLその2
woman laying on stomach
https://civitai.com/models/191593/woman-laying-on-stomach?modelVersionId=216780
うつ伏せで寝転がったポーズを指定するLoRA。SDXLのリアル系Modelの多くは、SD 1.5のModelと比較して、大胆なポーズやアングルなどがほとんど出ない。グラビアだと、開脚系、超ローアングル、そして寝転び系などだろうか。
これはセンシティブなフィルタがかかっているのではなく、単に学習していないだけの様だ。Sexy系のModelやLoRAを使えば普通に出る。
その苦手な中の一つ、寝転がり系を何とかするのがこのLoRAだ。Trigger Wordはwoman laying on stomach。文字通りお腹を下にした寝転がりとなる。横位置だと効果抜群だが、レイアウトの都合上、縦位置で掲載した。グラビアではありがちなポーズだが、これがあるのと無いのとでは大違い!
東京駅 東海道・山陽新幹線ホームSDXL
https://civitai.com/models/131749/sdxl?modelVersionId=144842
特定の場所を再現するLoRAで、ご覧の様に東京駅っぽい雰囲気と新幹線っぽいのが現れる(あくまでも似てるだけで現実とは異なる)。Trigger Wordは、STOKYO, train station, scenery, real world location, train。
筆者のXアカウントでこれと水着美女を組み合わせ「(撮影許可が出ないので)絶対撮れない写真」と掲載したらバズってしまった(笑)
作者swingwings氏の登録Model一覧を見ると、日本の公衆電話、コンビニの外観、鶏ガラベースのこってりが有名なラーメン店、餃子が美味しい料理店…面白そうなのが山盛り! 興味のあるLoRAがあったら是非試して欲しい。
作例は掲載しないが雑誌の表紙系LoRAで、 Maxim Magazine Korea SDXL 、VOGUE (Fashion Magazine Cover Vintage 1960-1975) 、この辺りが結構楽しめる。ネタに困った時など、ちょっとガチャってみるといいのでは?
+αはFooocus-MREの開発終了、本家Fooocusへ一本化
ここ最近、驚いた出来事として、以前連載でもご紹介したFooocus-MREの開発が10月1日をもって止まったことがあげられる。
本家Fooocusが非対応なちょっと痒いところに手が届く的な存在だったのでショックは大きい。おそらく本家の開発ペースが激速で、それをマージするのが大変だったのではないだろうか。
しかし面白い事に、今は本家のFooocusをFooocus-MREの作者、MoonRide303氏が一緒に開発し一本化。Fooocus-MREの機能の一部も取り込んでいる。鬼才二人のコラボ、今後益々楽しみと言えよう。個人的にはADetailer(解像度に合わせて顔を書き直す)が欲しいところ。
そして本家のFooocusは、Localization対応、anime/realisticプリセット対応など、日々機能拡張中だ。プリセットに関しては、animeがModelにbluepencil_v50 + dreamsharper_v8(refiner)、realisticが上記のrealistic_stock_photoを採用している。
加えてanimeプリセットでrefinerとして使っているdreamsharper_v8はSD 1.5用リアル系Modelで、それをrefinerにしてしまうと言う、離れ業までやってしまった。流石CotrolNetを作った人的発想だ。
今回の締めのグラビア
最近面白い事に気がついたのだが、Modelも画質関係のPromptも全く同じで、1人ではなく2人にしてちょっと怪しげな雰囲気(今回はKiss)を作ると、何故かよりリアルに見えてしまうこと。百聞は一見に如かず。如何だろうか!?
Promptだとこんな感じで、割と簡単に出すことが可能。掲載した写真は直前で止まってるのをガチャって選んでいるだけで、多くは結構派手にしている。
professional photo of two women with summer short dress, kiss together,
扉の写真もそうなのだが、おそらく見る側が勝手に妄想して、よりリアルに見えてしまうのだろう(目の錯覚?心の錯覚?)。なかなか面白い効果と言える。
以上、SDXL用のModelとLoRA+αをご紹介した。次回の内容は現在未定だが、1回目のセミナーで割とControlNetに興味を持っている人が多かったので、何回かに分けて記事にするかも知れない…。
生成AIグラビアをグラビアカメラマンが作るとどうなる?連載記事一覧