生成AIグラビアをグラビアカメラマンが作るとどうなる?第41回:外部サービスの生成AI画像はどんな感じ!? そしてFLUX.1 [schnell] の逆襲(西川和久)

テクノロジー AI
西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧


ImageFXなど外部サービスの生成AI画像の出来は!?

本連載では基本的にローカルで生成出来るモデルなどを主にご紹介しているが、今回は箸休め的にImageFXなど外部サービス系はどうなの?と、Promptを同じにして各社比較してみた。

ピックアップしたのは

  1. ImageFX (Google)
    https://labs.google/fx/ja/tools/image-fx

  2. ImageCreator (Microsoft)
    https://www.bing.com/images/create

  3. Grok2
    https://x.com/i/grok

  4. KLING (Kolors 1.5)
    https://klingai.com

  5. Recraft V3
    https://www.recraft.ai

  6. Midjourney
    https://www.midjourney.com

1~3までは説明の必要は無いだろう。アカウントさえあれば無料で生成できる。そう言う意味では4と5も同じで無料枠である程度の枚数を生成可能だ。

KLING(Kolors 1.5)は、去年(2024年)夏頃、Kolors 1.0がオープンで登場し、SD3 Mediumがダメだった後ということもあり結構盛り上がった。個人的にも次バージョンを期待していたものの、1.5はオープンにはならずサービス/APIでのみの公開となっている。

Recraft V3は、FLUX.1 [dev]が出た後、それを上回る性能として謎のコードネームRed Pandaとして登場、蓋を開けて見ると recraft.ai の生成AI画像モデル。

6のMidjourneyは、無料枠が無くなってしまったので$10/月のプランを使用している。

なおGrok2が1024x768でしか生成できないため、全て横位置4:3、一致しない場合は後からPhotoshopでトリミング)で出力し、公平を期すため(笑)、4枚出力した中、一番良さそうなのを筆者が選んでいる。

また外部サービス系は、NSFW的なキーワードや生成結果で肌色が多かったりすると拒否されるため、Promptは以下の通り無難なものに。Midjourneyは--ar 4:3 --style raw --s 750を加えて他と合わしている。

A young, beautiful Japanese woman working at her desk in a modern office setting. She is attentively operating a computer, with long, flowing hair and wearing a professional yet stylish outfit. The scene captures her focused expression as she works in a well-lit, contemporary office environment.

by deepseek-r1-distill-qwen-32b-mlx

1
2
3
4
5
6
7
8
  1. FLUX.1 [dev]

  2. FLUX.1 [schnell]

  3. ImageFX (Google)

  4. ImageCreator (Microsoft)

  5. Grok2

  6. KLING (Kolors 1.5)

  7. Recraft V3

  8. Midjourney

こうして並べるとそれぞれ特徴があって面白い。ImageCreatorとGrok2が少し時代に乗り切れていない感じだろうか。特にGrok2は、初期はそれなりに出ていたのに最近になって劣化した。エンジンを変えたのか、利用者が多く負荷を下げるためパラメータを触ったのか……謎だ。

次は少しSF的なもの。Promptも長くなる。この中にある”medium breasts,”は鬼門。Image Creator、Recraft V3、Midjourneyは弾かれる。従ってこの3つ関しては削除して生成した。

A dramatic, low-angle photograph of a solo Korean android woman standing in the midst of a science fiction battlefield. She has blue eyes, blonde hair, a slim build, medium breasts, and long flowing hair. Her robotic joints and circuits are visible, with a glowing robot structure surrounding her. She holds a weapon in one hand, adopting a confident stance. The scene is viewed from the side, showcasing her profile and the dynamic setting. Swirling seven-colored smoke envelops her body, adding an otherworldly ambiance to the composition.

by deepseek-r1-distill-qwen-32b-mlx

1
2
3
4
5
6
7
8

こちらは一転、ImageFXが全然ダメ(笑)。ImageCreatorもダメに加えて4:3にすると検閲(おそらく絵柄的)に引っかかり出ないため、たまたま出た1:1を4:3(不足部分はPohotoshopでoutpaint)にしている。Midjourneyは流石、FLUX.1 [schnell] も頑張っている。Recraft V3は先のOL編も含めて噂ほどでも無い…と言う感じだろうか。

試した範囲だとプレゼン資料用など一般的な絵が欲しい時はImageFX作品系はFLUX.1Midjourney。ある意味各社の狙い通り。ただMidjourneyは検閲が厳しく結果、筆者のケースだとFLUX.1一択。予想通りだ(笑)。

今回締めのグラビア - FLUX.1 [schnell] の逆襲

前回はschnellMODEで作った扉とグラビアを掲載した。[schnell] は生成は速いけど絵がイマイチ……。これを[dev]レベルにとまでは言わないまでも、もう少し良くなれば、GPUパワーの関係で使いたい人も多いのではないだろうか? そんな中、今年に入って[schnell]系のGoodなcheckpointがいくつか登場!

  1. schnellMODE (Merge) が V3.1からV3.3へ

  2. 2758 - Flux Asian Utopian (Trained)

  3. Shuttle-Mixes (Merge)

  4. Shuttle Jaguar (Trained)

下記、同じPrompt / 設定(Seedは異なる)の作例を掲載した。ただちょっとズル(笑)しており、顔LoRAを軽く(0.4)当てている。これは主に肌色が目的で顔を似せるためではない。[schnell] の場合([dev] もだが)、少し肌色のいいLoRAを当てるとグッとそれらしくなるのでお勧め。

Shuttle Jaguarだけ色が少し変わっててこれはこれでいい感じだし、普通になる様、ホワイトバランスを調整するのもありだろう。とは言え、Promptに”she walks through the picturesque park.”とあり、一番忠実なのはこれだったりする。

1
2
3
4

いかがだろうか? 本家の[schnell]とは随分違う絵となっているもが分かる。今回は2758 - Flux Asian Utopian扉とグラビアを生成した。この2つに関しては加えてDetail Daemon Upscaleで情報量も増やしている。

2758 - Flux Asian Utopianを使ったグラビア!

がらっと雰囲気変わった音楽系。これらが4stepsと速い生成時間が特徴の[schnell] で行けるならありでは!? 次回はRTX 5090試用記になるのか乞うご期待(笑)

生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧

《西川和久》

Amazon売れ筋ランキング

西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。