生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧
Detail Daemonとは?またその効果は?
前回Stable Diffusion 3.5 Large TurboとMediumの話をしたが、扉とグラビアにDetail Daemonを使用、詳細は次回と予告したので、今回はDetail Daemonの話にしたい。
Detail Daemon、詳しい内容までは筆者も把握していないのだが、簡単に説明すると「元画像に追加書き込みする」機能だ。
類似する機能で一番分かりやすい例だとUpscale時のDenoise。リアル系の時は0.2~0.4程度にするが(そうしないと顔が大きく変わる)、もしDenoiseがないUpscaleだと、指定倍率に拡大しただけのスカスカ画像になってしまう。これを防ぐのにDenoiseを使いPromptや周囲の情報から追加書き込みをし、擬似的に情報量を盛っている。
Detail DaemonはDenoiseとはロジックが違うものの追加書き込みをし、同様に画像の情報量を増やす機能となる。
論より証拠。以下に元画像、Denoiseを使った通常のUpscale、Detail Daemonを使ったUpscaleの3枚、顔中心に拡大して並べてみた(元画像だけ解像度が異なるので同じサイズになっていない)。
Upscaleは1.58x、Denoiseは0.2、Detail Daemonの書込み量調整箇所のdetail_amountは0.6。いかがだろうか?普通のUpscaleは元画像をそのまま拡大した感じだ。対してDetail Daemonは、ほうれい線や目の下のクマが増えている。また口の形も少し違う。ただ通常のUpscaleと比較して肌がよりリアルっぽくなっている。
これはリアルな写真をツールを使いほうれい線や目の下のクマを消した時と逆の現象が起こっている。つまり、ほうれい線や目の下のクマを消すと結果盛れて綺麗にはなるが、その分、本人と少し違う顔になる。
理屈的にはそうなのだが、実際目の前で逆の現象を見ると「お!なるほど」といった感じだ。また変わり方が気に入らない場合は、seedを変えるか、detail_amountの数値を調整し、気に入ったのが出るまでガチャることになる。
ではComfyUIのWorkflowをご紹介する。
ComfyUIでDetail Daemonを使う
ComfyUI用のカスタムNodeは ここ にあるのでcustom_nodes/でgit cloneするか、ComfyUI Managerでインストールする。他に必要なのはUpscaleで使う場合は、Upscale用のmodel。SD 1.5の頃からいろいろ試したが、個人的には 4x-UltraSharp.pth がお気に入りだ。これを models/upscale_models/ へ入れておく。
GitHubのWorkflowサンプルを見ると5つある。
同一Prompt、解像度でのtxt2img比較
img2img
Inpaint
Detail Daemonを使ったUpscale(上記のもの)
SDXL + Detail Daemonを使ったtxt2img
ここでは上記したUpscaleの4と、5のSDXLとのコンビネーションが面白そうなので試してみたい。
まずUpscaleから。オリジナルから変えたのは、checkpoint/clip/vaeのNode 3点セットになっているのをload checkpointで1つのNodeにした程度。FLUX.1 [dev] fp8の全部入りを使用した。またPromptは元画像に合わせている。Upscaleの倍率は2x。Upscale用のmodelは4x-UltraSharp.pth。
印象は先に書いた通り。少し顔は変わるものの、よりリアルっぽくなっている。もちろん元画像はSD 1.5やSDXL、そして本当の写真でも何でも良い。
余談になるが、checkpointにSD 3.5系も指定可能。この時、中央下辺りにある”ModelSamplingFlux”を"ModelSamplingSD3"にすればOKだ。
続いてSDXLを使ったtxt2img。checkpintは sd_xl_base_1.0 を使用。vaeも合わせている。また1024x1024だったのを掲載サイズにするため832x1216へ。
おそらく比較しやすい様、パラメータは強めにしていると思うが、ご覧の様に構図そのまま、細かさが雲泥の差。従来のSDXLのイメージとは全く違う絵となる。これはこれで面白い。
今回締めのグラビア
前回はSD 3.5 Medium + Detail Daemon Upscaleだったので、今回は扉もグラビアもSD 3.5 Large Turbo + Detail Daemon Upscaleとしてみた。
SD 3.5 Large Turboの利点はとにかく生成速度が速いこと。ミドルレンジGPUでも数秒で出る。欠点はその分、ざっくりとした絵なのだが、そこをDetail Daemonで補うと言う、ある意味ベストマッチ。とにかくガチャって「お♪」が出たらDetail Daemon Upscale。なかなか良いコンビだ。
次回はほんの数日の間にFLUX.1 ToolsやSD 3.5 Large(Turbo込み)対応ControlNetが出たので、その話をしたいと思う。