みなさん、AIサブスクしてますか?
個人的な話で恐縮ですが、筆者は毎月13万円ほど生成AI関連のサブスクリプションにお金を使っていることが、先日判明しました。
この12月に家の30年ローンを払い終わったのですが、それとほぼ同額です。
2024年の中頃に一度サブスク関係を試算したときの、ほぼ2倍になっているのです。
で、現在の状況を明らかにしておこうと思います。
米ドルの場合は1ドル152円換算。年払いの場合はそれを12等分しています。
Adobe CCが大したことないように見えてしまうのは錯視でしょうか。
深刻なのが、動画生成関連のサービスです。HeyGen、Runway、Luma、Soraと、Unlimitedプランを使おうとすると1~3万円の出費を余儀なくされます。個別にクレジットを追加購入するとさらに料金アップするのでこれでも節約になってるというのが、生成AIガチャの怖いところです。
一つのサービスで他が不要というのならいいのですが、完全なものはまだ存在せず、ちゃんと作ろうとすると複数のサービスが必須。そして地獄のように出費が嵩んでいきます。
それでも不要なものまで払っている義理はありません。そこで、現在使っている動画生成AIの実力を比較してみることにしました。
筆者は基本的に人物のImage to Videoしか使わないので、それで比較。FLUX.1 [schnell] + LoRAで生成した画像を、Pyramid Flow、Runway Gen-3 Alpha Turbo、Sora、KLING、Hailuo、Pika、Luma Dream Machine、Viduにそれぞれ動画化させて並べてみました。
音がないと寂しいので、動画に自動的にサウンドをつけてくれるMMAudioというソフトを適用しました。
これは、PinokioというAI仮想環境ソフトを使い、M4 Max MacBook Proで動かしています。10秒の動画であれば20秒かからずにそのシーンにあったサウンドをつけてくれて便利です。
今では音がついていない生成AI動画とかは考えられないくらい便利に使っています。オープンソースソフトをローカルマシンで動かしているので無料ですしね。
さて、結果はこんな感じです。
最初に出てきたPyramid Flowは以前紹介した、オープンソースモデルの動画生成AI。時間がかかるんですが、ローカル処理できるし、人物に関してはなかなか性能いいんですよね。
好みでいくと、KLINGがトップで、次にHailuo、その次にPyramid Flow、Runwayがくる感じ。Lumaも最近のモデルは良くなっています。
Soraは出てくる顔があまり好みではないです。
かなり出遅れていたPikaも少し良くなりはしていますが、表情とか瞼の辺りに不自然さが残ります。Ingredientsという、複数の画像から新しい動画を作る技術はなかなか魅力的なので、ちょっと今は外せない。
妻がボーカルを取っている、筆者の学生時代のバンド写真が2枚残っているのですが、その写真がボケすぎて、ReminiなどのAIアップスケーラーを使っても鮮明にはなりません。
Pika Ingredientsでは、顔がはっきり写っている同時代の別の写真を組み合わせ、動画にできるのです。写真に写り込んでいるSharp MZ-80K2Eが動画の中にも存在しています。
Pikaはちょっと前まで、ヘンテコなエフェクトを音付きで出すキワモノ機能だけで生き延びようとしていたのですが、Ingredientsで息を吹き返した感じです。一度は無料プランに切り替えたのですが、また復活させてしまいました。なかなか切れない。
そしてどうしてもダメなのがVidu。人物が写っているのは最初の部分だけであとは謎エフェクトという動画ですが、これでも4、5回だしたベストテイクなので、もうサブスクからはずした方がいいかなと思っています。
2025年1月になれば、高品質でSora超えたのではという評価も高いHunyuan VideoにImage to Videoが追加されるらしいので、そうしたらローカル動画生成の方が高性能、という時代が来るかもしれません。
昨日開催したAIグラビアワークショップの前に西川和久さんと話していたのですが、「じゃあRTX 5090(仮)買う必要あるな」という結論となりました。
しかし、そうするとAIサブスクを減らすどころか、AIハードウェア課金が増えていくことになりますね。実際、M4 Max MacBook Proの24回払いは月額3万円超えてるので……。
まあ、半年前にはできなかったことが可能なのだから、すごいことではあるんですけど。
結論から言うと、いくらサブスクを切り詰めようとしても、ローカルでやるために必要なハードウェア投資はかかりますよ、そして、そのちゃんとやろうとすると両方が必要となるのでさらに地獄度は深まりますよ、ということでしょうか。
Soraを超えてると評判のGoogle Veo 2ですが、「お、うちのほうが高性能だから月額3万円にすればみんなサブスクすんじゃね?」とかなりそうで怖いです。
Veo 2にしても、Google DeepMindが出した比較だとKLINGとほぼ互角なので、世間の評価ほどじゃない可能性もありますが。そして、検閲は一番厳しいだろうし。