生成AIグラビアをグラビアカメラマンが作るとどうなる?第47回:HiDream-I1-Full/Devをローカル生成+α(西川和久)

テクノロジー AI
西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

HiDream-I1-FullとDevの違いは!?

前回、HiDream-I1の速報的な内容で、GGUF版とDev版の話をした。但しDev版の多くは recraft.ai で生成と、ローカルPCでの生成が間に合わなかった構成となっている。


後半で触れたが入稿直後にComfyUIが HiDream-I1 にネイティブ対応したため、急遽Workflowをご紹介したが、今回改めてFull/Dev/Fast全てのWorkflowを掲載したい。Checkpoint/(Quad)CLIP/VAE Loader、ModelとKSamplerの間にModelSamplingSD3 Node (Shift) が入る簡単なWorkflowとなる(以下全ての作例はfp8を使用)。

HiDream-I1-FullのWorkflow
HiDream-I1-DevのWorkflow

この2つが基本系。FullはCFGが1より大きく、Negative Promptが有効なため入力するNodeが増えている。FastのWorkflowが無いが、StepsとShiftの値が変わるだけでDevと同じだ。違いを表にまとめたので参考にしてほしい。

Full

Dev

Fast

Steps

50

28

16

CFG

5.0

1.0

1.0

Sampler

uni_pc

euler

euler

Shift

3.0

6.0

3.0

なお、FullのCFG 5.0は少しハイコントラスト気味(作例は全て5.0)。浅くしたい場合は数値を減らす。個人的には3.5が好みだったりする。

各モデルのダウンロード先は以下の通り。ComfyUI/models/unet、clip、vaeへそれぞれ入れれば良い。

checkpoint (fast-fp8 | bf16, dev-fp8 | bf16, full-fp8 | fp16)
text_encoders
vae

以降、Full(左)Dev(右)比較となる。上記の変更が必要なパラメータ以外はSeedも含め全く同じだ。

ざっくり、Fullの方が色や絵に深みがあり、逆にDevは平面的な感じがする。但しどちらも処理は重くRTX 5090を使いFullで約33秒Devで約19秒となる(参考までにFastだと約12秒)。

余談になるが、HiDream-I1自体は17Bで、テキストエンコーダーに llama/Meta-Llama-3.1-8B-Instruct も使っている関係で、Promptを日本語で書くことも出来る。とは言え8Bだともともと日本語はあまり得意ではないためザックリな生成となってしまうのは仕方ないところ。

llama/Meta-Llama-3.1-8B-Instructを使っているので、日本語のPromptでもある程度は生成出来る

これはPromptに”オフィスで働いている研修中の日本人女性”と書いた時のFullの生成結果だ。この程度であれば生成可能なので興味のある人は日本語Promptも試して欲しい。

HiDream-I1-Full/Dev/fastとFLUX.1 [dev]を比較してみる

同一環境、同一Promptで、HiDream-I1-Full/Dev/fastとFLUX.1 [dev]を比較してみたい。HiDreamについては上記の作例同様、変更が必要な項目以外は全く同じ。FLUX.1 [dev]はSteps 30(9.21秒)で同じSeedだと可愛くなかったため(笑)Seedだけ変えている。

Promptの肝は

  1. young Japanese woman

  2. off-shoulder t-shirt

  3. She wears round glasses with silver frames

  4. 7colors background

この4つ。まずHiDreamは、全て生成した画像にほぼ(Devだけoff-shoulderが抜けている)反映しているものの、Full/Dev/Fastの順に色が薄くなっていくのが分かる。Photoshopなどを使い後処理で少し修正したい感じだ。

FLUX.1 [dev]は アジア系ではあるものの young Japanese woman が微妙7colors backgroundは全く出ていない但し肌の質感に関してはFLUX.1 [dev]の方が上…と言ったところだろうか。両方の いいとこ取り をしたcheckpointが欲しい!?

今回締めのグラビア

今回締めのグラビアは扉と共に上記のHiDream-I1-Fullを使い、掲載解像度の関係で、Detail Daemon 1.58x Upscaleしている(checkpointはHiDream-I1-Devを使用)。FLUX.1 [dev]と比較して色の感じや、ベースモデルで日本人を含むアジア系の顔が美人で出るのは嬉しいポイント。ただ肝心の肌の質感がノッペリしておりイマイチ…と言うところだろうか。

HiDream-I1-Fullを使ったセクシー着物?グラビア!

この点に関しては、CivitaiにチューニングしたCheckpointやLoRA、そして肌専用のLoRAがぼちぼち載り始めている。SDXLやFLUX.1も初期は同じ様なものが載っていたので時代は繰り返す!?(笑)。

話題のNotebookLMを使って、この記事について語る対話型ポッドキャストを生成してみました。

《西川和久》

西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。