HiDream-I1-FullとDevの違いは!?
前回、HiDream-I1の速報的な内容で、GGUF版とDev版の話をした。但しDev版の多くは recraft.ai で生成と、ローカルPCでの生成が間に合わなかった構成となっている。
後半で触れたが入稿直後にComfyUIが HiDream-I1 にネイティブ対応したため、急遽Workflowをご紹介したが、今回改めてFull/Dev/Fast全てのWorkflowを掲載したい。Checkpoint/(Quad)CLIP/VAE Loader、ModelとKSamplerの間にModelSamplingSD3 Node (Shift) が入る簡単なWorkflowとなる(以下全ての作例はfp8を使用)。


この2つが基本系。FullはCFGが1より大きく、Negative Promptが有効なため入力するNodeが増えている。FastのWorkflowが無いが、StepsとShiftの値が変わるだけでDevと同じだ。違いを表にまとめたので参考にしてほしい。
Full | Dev | Fast | |
Steps | 50 | 28 | 16 |
CFG | 5.0 | 1.0 | 1.0 |
Sampler | uni_pc | euler | euler |
Shift | 3.0 | 6.0 | 3.0 |
なお、FullのCFG 5.0は少しハイコントラスト気味(作例は全て5.0)。浅くしたい場合は数値を減らす。個人的には3.5が好みだったりする。
各モデルのダウンロード先は以下の通り。ComfyUI/models/unet、clip、vaeへそれぞれ入れれば良い。
checkpoint (fast-fp8 | bf16, dev-fp8 | bf16, full-fp8 | fp16)
text_encoders
vae
以降、Full(左)とDev(右)の比較となる。上記の変更が必要なパラメータ以外はSeedも含め全く同じだ。
ざっくり、Fullの方が色や絵に深みがあり、逆にDevは平面的な感じがする。但しどちらも処理は重く、RTX 5090を使いFullで約33秒、Devで約19秒となる(参考までにFastだと約12秒)。
余談になるが、HiDream-I1自体は17Bで、テキストエンコーダーに llama/Meta-Llama-3.1-8B-Instruct も使っている関係で、Promptを日本語で書くことも出来る。とは言え8Bだともともと日本語はあまり得意ではないためザックリな生成となってしまうのは仕方ないところ。

これはPromptに”オフィスで働いている研修中の日本人女性”と書いた時のFullの生成結果だ。この程度であれば生成可能なので興味のある人は日本語Promptも試して欲しい。
HiDream-I1-Full/Dev/fastとFLUX.1 [dev]を比較してみる
同一環境、同一Promptで、HiDream-I1-Full/Dev/fastとFLUX.1 [dev]を比較してみたい。HiDreamについては上記の作例同様、変更が必要な項目以外は全く同じ。FLUX.1 [dev]はSteps 30(9.21秒)で同じSeedだと可愛くなかったため(笑)Seedだけ変えている。
Promptの肝は
young Japanese woman
off-shoulder t-shirt
She wears round glasses with silver frames
7colors background
この4つ。まずHiDreamは、全て生成した画像にほぼ(Devだけoff-shoulderが抜けている)反映しているものの、Full/Dev/Fastの順に色が薄くなっていくのが分かる。Photoshopなどを使い後処理で少し修正したい感じだ。
FLUX.1 [dev]は アジア系ではあるものの young Japanese woman が微妙、7colors backgroundは全く出ていない。但し肌の質感に関してはFLUX.1 [dev]の方が上…と言ったところだろうか。両方の いいとこ取り をしたcheckpointが欲しい!?
今回締めのグラビア
今回締めのグラビアは扉と共に上記のHiDream-I1-Fullを使い、掲載解像度の関係で、Detail Daemon 1.58x Upscaleしている(checkpointはHiDream-I1-Devを使用)。FLUX.1 [dev]と比較して色の感じや、ベースモデルで日本人を含むアジア系の顔が美人で出るのは嬉しいポイント。ただ肝心の肌の質感がノッペリしておりイマイチ…と言うところだろうか。

この点に関しては、CivitaiにチューニングしたCheckpointやLoRA、そして肌専用のLoRAがぼちぼち載り始めている。SDXLやFLUX.1も初期は同じ様なものが載っていたので時代は繰り返す!?(笑)。
話題のNotebookLMを使って、この記事について語る対話型ポッドキャストを生成してみました。