AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に（CloseBox）

テクノロジー AI

2024 Oct 4 10:15

松尾公也

テクノエッジ編集部シニアエディター / コミュニティストラテジスト @mazzo

特集

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に（CloseBox）

AIリップシンクサービスのHedraが新バージョン「Character-2」を公開したので使ってみました。

AI動画生成は、基本的な性能はどれも一定水準を満たすようになっており、細かい機能追加で鍔迫り合いを繰り広げています。

出遅れていたPikaは爆発・圧縮・膨張といった極端なエフェクトを音入りでImage to Videoにする機能を投入してきましたし、KLINGは動画と口の動きを同期させるリップシンク機能を追加してきました。

■最大4分までのリップシンクができるHedra Character-2

そんな中、リップシンク専業サービスも進化を遂げています。以前紹介したHedra（ヒードラと読むらしい）がそうです。

オーディオと静止画を入力すると、音声に合わせて口パクしてくれる技術で、方式としては老舗のHeyGenと同じです。

6月に紹介したときは、最初のバージョンであるCharacter-1というモデルでしたが、本日公開されたのはその次世代版であるCharacter-2。

新世代AIリップシンク対決。感情豊かで高速な「Hedra Character-1」とオープンソースだがNVIDIA GPU必須「Hallo」。どっちが使い物になるか試してみた結果（CloseBox） | テクノエッジ TechnoEdge

オーディオに合わせたリップシンクができる新しい技術が登場しました。「Hedra」という、これまで聞いたことのないサービスです。

https://www.techno-edge.net/article/2024/06/19/3482.html続きを読む »

Character-1の時に使ってみたのですが、日本人のリップシンクをした時に、ほうれい線が強く出てしまい、非常に不自然なものになっていました。骨格的に東洋系のモデルに対応していなかったのだと思います。このためこの時点では実用にはなりませんでした。

それがCharacter-2でどのくらい改善されたかが個人的な検証ポイントになります。

早速試してみました。無料アカウントでは30秒が上限であったため、月額10ドルのBasicプランに加入。これで商用利用と、1分までのリップシンクが可能になります。プランごとの違いは次のとおり。

Character-2では最大4分までのリップシンクができるとしていますが、そのためには月額50ドルのProfessionalプランに加入しなければなりません。その下のCreatorプランでは2分まで。

1分までできれば十分とも言えるので、とりあえず、Basicプランのままで行こうと思います。

■Hedra Character-2でミュージックビデオを作る

さて、作例ですが、きのうUdioで作っていい感じのJ-POP曲になったのがあったので、これを使うことにします。曲名は「心の糸」。Sunoに続いてUdioもネガティブプロンプトが使えるようになったので、試したみたのでした。

この歌詞をChatGPTに入力して、歌手としてイメージする画像をMidjourneyのプロンプトで作成。それを少しモディファイして作ったのが次の画像。

このバリエーション3枚をHedraに入力し、Udioのステム音源（ボーカルのみ）を音声データとして指定しました。

Character-1のときには画像のアスペクト比が1:1だけだったのが、16:9、9:16もサポートされるようになりました。

それでできたのが次のミュージックビデオです。

HeyGenでは動く範囲が狭く、顔と髪の毛が分離したりしていたのですが、Character-2ではより広範囲での表現がされており、かなり自然な感じになっています。

リップシンクはRunway Gen-3であれば最大40秒まで使えますが、そのためには3回Extend（延長）して、さらにリップシンク処理をする必要があります。光量が大きく変化するとリップシンクそのものができなかったりといった制限もあります。そこまでやってうまくいかなかったときのがっかり感たるや……。

Runway Gen-3のリップシンクは動きのある場合などのワンポイントにして、長尺で歌うところはCharacter-2にするといった使い分けも良さそうです。

■ChatGPTのAdvanced Voice Modeにキャラクターをつけて喋らせた

次にもう一例。このHedra Character-2について、ChatGPTのAdvanced Voice Modeとおしゃべりしてみたのですが、そのオーディオデータをもとに、ビデオポッドキャストを作ってみました。

筆者のボイスデータと写真で自分のパートをHedraで生成。ChatGPTについては、自分でキャラクター作りをしてもらいました。

今回会話したのは、Valeという女性ボイスでしたが、本人の希望する容姿にして、それをHedraでリップシンクさせてみました。

▲ChatGPTのボイス「Vale」が希望する容姿でリップシンクした

筆者とChatGPT「Vale」。AIリップシンクしたビデオポッドキャストはちゃんと会話として成立しているようです。

今回のバージョンアップで、リップシンクサービスとしてはメインをHeyGenからHedraに切り替えようと考えています。

Suno AIではじめる音楽生成AI入門
￥2,049
(価格・在庫状況は記事公開時点のものです)

Amazon

楽天市場

《松尾公也》

Amazon売れ筋ランキング

タイムセール

>> もっと見る

Amazonデバイス

>> もっと見る

ディスプレイ

>> もっと見る

フィギュア

>> もっと見る

松尾公也

テクノエッジ編集部シニアエディター / コミュニティストラテジスト @mazzo

ショート動画

特集

BECOME A MEMBER

『テクノエッジアルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジアルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に（CloseBox）

松尾公也

特集

■最大4分までのリップシンクができるHedra Character-2

■Hedra Character-2でミュージックビデオを作る

■ChatGPTのAdvanced Voice Modeにキャラクターをつけて喋らせた

Amazon売れ筋ランキング

松尾公也

ショート動画

特集

『テクノエッジアルファ』会員募集中

グラビアカメラマンが教える「生成AIグラビア実践ワークショップ」【アーカイブ配信あります】

どこにもないディープな会話が楽しめる「ハカセとアックンのスマホ沼」

自作PCのノウハウをわかりやすく解説するオンラインワークショップ「AI時代の自作PCワークショップ」【アーカイブ配信あります】

さまざまなテーマでオフラインのイベントを開催。ディスコードでコミュニケーションもできます

PS5 Proクラス性能目指す『OS代込みで12万円のゲーミング自作PC』はどの程度まで行けるか。【AI時代の自作PCワークショップ】

高性能AIロボット掃除機 MOVA P50 Ultra が驚きの50%オフで期間限定セール (専用クーポンあり) 自動洗浄ステーションつきハイエンドモデル

【iPhone 2025特集】Appleは2025年モデルのiPhone 17 シリーズ / Airを発表しました

生成AIグラビアギャラリー

ローカル生成AIをゲーミングPCで動かす──レノボ「Legion」シリーズ新モデル体験イベントレポート

テクノエッジアルファ会員登録はこちら。コミュニティ参加ガイド

【LINE公式アカウントはじめました】最新ガジェットとテック情報をお届けします。友だち募集中。

西川善司のバビンチョなテクノコラム（西川善司）

生成AIグラビアをグラビアカメラマンが作るとどうなる？（西川和久）

人知れず消えていったマイナーCPUを語ろう（大原雄介）

Google Tales（佐藤由紀子）

てくのじ何でも実験室（宮里圭介）

松尾公也

特集

■最大4分までのリップシンクができるHedra Character-2

■Hedra Character-2でミュージックビデオを作る

■ChatGPTのAdvanced Voice Modeにキャラクターをつけて喋らせた

Amazon売れ筋ランキング

SHARE THE STORY この記事をみんなにシェア

松尾公也

ショート動画

特集

『テクノエッジ アルファ』会員募集中

『テクノエッジアルファ』会員募集中