動画生成AIはRunwayを筆頭に、中国系サービスも参入し、激しい開発競争を繰り広げていますが、オープンソースソフトもかなりのレベルに到達しています。
Image to Video、つまり静止画を短い動画にできる動画生成AIの新サービスが登場しました。中国の「Hailuo」(ハイルオ)がそれで、中国製動画生成AIとしては、KLING、Viduに次ぐ3番手となります。
この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第65回)では、対話スピードや会話中の割り込みの自然さなど、人間と話しているかのような会話ができるモデル「Moshi」や、ByteDanceが開発した音楽生成・編集モデル「Seed-Music」を取り上げます。
AIリップシンクにまた大きな波が訪れました。
1枚の人物画像から動画を生成するAIモデルが4種類、揃いました。Luma AI Dream Machine、Runway Gen-3 Alpha、KLING、Vidu。これらを同じ人物写真(画像)、同じプロンプトで比較してみます。
KLINGのサブスクリプションが開始されたばかりですが、翌日の7月31日に早くもライバルが登場しました。同じく中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末辺りからSoraクラスの動画生成AIとして発表され、注目はされていました。このViduが一般利用可能になったのです。
動画生成AIはわずか1カ月ちょっとで急激な進化を遂げました。この期間の進化を、人物Image to Videoに絞ってまとめてみます。