グラビアカメラマンがAI生成したグラビア写真をAIで動画化してみた。架空ゲームショウの謎コスプレもあるよ(西川和久&松尾公也)

テクノロジー AI
西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

今回は、過去作った記事などのヘッダー画像+αから松尾氏に動画を作っていただくという、コラボ企画。元画像はSD 1.5、SDXL、SD3 Medium、そしてFLUX.1 [dev] が入り乱れての動画となる。

こうして観ると意外なのがSD 1.5で作った雪&スノーボードの画像。結構雰囲気が出ておりいい感じだ。SDXLは中途半端。SD3 MediumとFLUX.1 [dev] は流石といったところか。

動画は、Runway Gen-3 Alpha TurboのImage to Videoでプロンプト指定なしで生成。1280×768ピクセル、24FPSのMPEG-4ムービーだ。

記事末尾に、まとめたYouTubeを掲載しているので、一気見したい方はそちらで。

【生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧| テクノエッジ TechnoEdge】


■クリスマス (SDXL)

SDXLなので今見ると実写というより2.5D。とはいえ雪が降ってる雰囲気や体の動き、表情の変化などは悪くない。これを作った時はStable Video Diffusion (最大2-3秒) があった程度で、まさか一枚の画像から10秒も行けるとは思ってもみなかった。

■スノボ (SD 1.5)

今回の中では唯一のSD 1.5。ちょっとセピアがかって、古めの写真に見えるのが逆に丁度いい感じになっている。体とカメラが動いて、それぞれが妙にマッチしている。

■温泉&雪 (SDXL)

途中から顔が丸顔に変わったり、遠近感がおかしいものの、全体の雰囲気は悪く無い。来年はFLUX.1 [dev]で再挑戦したいお題だ。

■桜 (SDXL)

腕が動き出すまでは表情も含めなかなかGood。静止画から10秒 (以上?) の動画が作れるようになっても、実際使えるのは間の5秒前後。これをつないで1つの動画にするという感じだろう。Xのタイムラインにはたまに物凄い動画があがってたりする。

■ComfyUI (SDXL)

顔に図形が被らなければ満点なのだが (笑) 惜しい。雰囲気は出てるので、この件さえクリアすれば、オープニングなどに使えそうだ。

■部屋1 (正面) (SDXL)

グラビアイメージでありがちな正面でスローのズームイン/アウト的な動画。特に破綻もないので安心して観てられる。これが水着なら、胸元に寄ったり、下に下がったりするのだが……。企業の動画生成サービスだとセンシティブに引っかかり作れない (笑)。

■部屋2 (斜め) (SDXL)

これも途中から丸顔になっているのが気になる。他は先の正面からの斜め版と言った感じだ。お!と思うのは眼に被った髪の毛が結構自然なことだろうか。このクラスの動画がローカルでそろそろ作れそうだが、PCのスペックは……。速くてVRAM 24GBを超えるのが欲しい! (笑) 。

■外&キャミソール (SD3 Medium)

ここからSD3 Medium。SD 1.5やSDXLとは違い一気に実写っぽくなる。画像から動画を生成する時、元画像のクオリティはかなり重要と言うことだ。ふわふわした感じが初夏っぽくていい雰囲気。

■川 (SD3 Medium)

悪くはないのだが、潜水艦が潜った (浮上?した) 感じの動画になっている (笑)。もう少し、体のパーツが揺れるなど、動きに工夫が欲しいところ。

■ひまわり(FLUX.1 [dev])

爽やか系の化粧品か飲料水に使えそうな動画だ (笑)。途中で顔が変わるなど、一貫性がイマイチだが、動画の進化は写真よりも凄まじく、来年だともう分からなくなるのではないだろうか。

■架空のゲームショウ2024 (FLUX.1 [dev])

ここまでは過去の画像を使っているが、ゲームショウ会場っぽいのはちょうどゲームショウ2024開催中なので新たに作ってみた。

FLUX.1は2MPまで対応しているので、いきなり1920x1088ピクセルの画像を生成可能 (トリミングして1920x1080にしている)。先のひまわりも含め解像感が他と別次元。

背景に人が多く入ると、そっちが動き、被写体があまり動かなくなってしまい、背景の残りの人も止まったままということも。

と、筆者個人的には動画にも興味あるのだが (元々グラビアは写真だけでなく、動画も撮影/編集していた)、動画まで手を出すといくら時間があっても足らなくなるので自主規制。もし来年、ローカルで画像から同レベルの動画が気楽に作れるようになったら挑戦してみたい。

松尾氏がRTX 4090マシンで試しているCogVideoではNSFWフィルターがないらしいが、画質もフレームレートも商用サービスには劣るそうで、それを理由にしばらくはやらないでおこうと思う。仕事をしなくなるので (笑)。


■全動画+おまけ未使用カットをYouTubeで公開

本記事で紹介した動画(画質劣化なし)をYouTubeで公開しているので、そちらもぜひ参照していただきたい。架空ゲームショウの未使用カットつき。まとめてみると、何かmodelの遷移みてる感じで面白い。


《松尾公也》

西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。