生成AIグラビアをグラビアカメラマンが作るとどうなる?第45回:FLUX.1 [dev]より高性能!?Reve Image登場+α(西川和久)

テクノロジー AI
西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧

いきなり登場したReve Image

3月21日、Xのタイムラインがざわめき出した。どうやら新種の生成AI画像モデルが登場したらしい。今回も残念ながらオープンではなくReveと言うウェブサービス。当初はプレビュー版でかなりの枚数作っても無料。筆者は300枚程度作っただろうか?(笑)。

これで分かったことは、ハズレもあるのだが、当たると「え?これデジイチで撮った写真!?」的な画像が生成され、明らかにFLUX.1 [dev]を超えている。遂に出たか♪という感じだ。

が、この関係でアクセスが集中し、一時期はアクセス制限が入ったり、一瞬Free/有料プランも掲載されたが、3月28−29日現在、元の状態に戻っている。追記:また変わるかも知れないが3月30日時点でFreeだと32~40?枚/日(NG画像含まず)

Reve Imageはいろいろなオプションがあり、縦横比は、9:16、2:3、3:4、1:1、4:3、3:2、16:9。一度に生成する枚数1/2/4/8。Enhanced ON/OFF(Prompt拡張)、Seed指定、そしてリファレンスとなる画像もアップロードできる。

なおEnhanced ONの時は間にLLMが入るのだろう。日本語でのPromptもOKだ。参考までにセンシティブ系は、(確認した範囲で)Promptノーチェック画像でNGな場合は画像全体にモザイクがかかる。

Reveの画像生成 / 画像一覧画面

論より証拠。いろいろパターンを変え、作例を8枚掲載した。今回は実写系だが、もちろんイラスト/アニメ系も生成可能。一部ファンタジーっぽいのも含まれているが、かなりリアルな写真に近い感じだ。

ただ、毎回この質感が出るわけでなく前述のようにハズレもある。特に後述するリファレンス画像を使った場合は、リアル度が少し落ちる。現在プレビュー版なのでこの辺りは調整中だと思われる。

生成後、画像を選び、画面キャプチャの様にEdit PromptでPromptの再編集が可能。加えて、候補になりそうなワードがプルダウンで表示される。

Instructを選ぶと、画像をどう変化させたいか?の指定=img2img的にも対応。並んでいるサムネイルの多くはInstructを使い、イメージに近づける様、七難八苦している様子だ(笑)。

生成後のオプション2つ

Reve Image、筆者的に最大の弱点は、とにかく可愛い or 美人がなかなか出ず(普通の子が出て好みとの意見もある)、その分、ガチャ率が上がること(笑)。ここさえクリアしてくれればGoodなのだが……。

ワンショットで顔が似る!?ComfyUI_InfiniteYou

生成AI画像で顔を似せるには学習させLoRAにするのが一番堅いのはご存知の通り。ただこの場合、結構なGPUリソースや時間、そしてそれなりの枚数の写真が必要……と、少しハードルが高い。

これを学習無しで一発(ワンショットと言う)で似せるのがご紹介するbytedance開発のInfiniteYou。出た当初、オリジナルのを動かそうとしたがRTX 5090の32GBでもVRAMが足らず撃沈(笑)。そうこうしている間にComfyUIのカスタムNodeが出たので試すと今度は上手く行った。ライセンスはApache-2.0。

このInfiniteYou、モデルsim_stage1aes_stage22つあり、より似るのは前者だが、後者はPromptの反応なども含め総合的には上とのことでこちらがお勧めとなっている。

インストール方法は簡単!

cd custom_nodes/
git clone https://github.com/ZenAI-Vietnam/ComfyUI_InfiniteYou
python ComfyUI_InfiniteYou/downloadmodel.py
pip install -r ComfyUI_InfiniteYou/requirements.txt

とすればOK。いろいろあるモデルはdownloadmodel.pyで全て所定のフォルダに入れてくれる。GitHubにはsim_stage1用aes_stage2用、2つのWorkflowが用意されており、今回は後者を使用。ただしFLUX.1 [dev]がvae、clip_l、t5とバラバラになっていたので、AIOのflux.1-dev-fp8が使える様、少しだけ修正している(赤い背景のNode)。

ComfyUI_InfiniteYouのWorkflow

結果はこんな感じだ。似てると言えば似てるし、似てないと言えば似ていない(笑)。なおInfiniteYou Nodeの一番下、fixed_face_posetrueにすると、ポーズなどは同じになるもののより似る感じとなる。またオリジナル写真は出来れば真正面がいいようだ。

RTX 4090で初回3分ほどかかるが(以降は普通のSteps 30)、LoRAを作るよりははるかに速い。興味のある人は試して欲しい。

今回締めのグラビア

今回締めのグラビアは扉と共に上記のReve Imageを使い、掲載解像度の関係で、Detail Daemon 1.58x Upscaleしている。春!って雰囲気でいい感じだ。そういえば、扉の写真、飯田橋にこんな風に撮れそうな川縁のカフェがある。久々に行ってみるかな?

Reve Imageを使ったグラビア!

執筆時、東京都内は結構桜が咲いており、週末は花見!と思ってたところ……雨。毎年同じパターンなのだが、見頃の週末は雨率が高くそして寒い。その分、執筆は捗り何とか月内間に合った(笑)。

生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧

《西川和久》

西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。