AI作曲サービスのトップを競い合っている、大手レコード会社に訴訟され仲間であるSunoとUdioが相次いで機能強化を発表しました。
まず、Sunoに、ステム分離機能が追加されました。
ステム分離とは、楽器のパートごとにトラックを分ける機能。UVR5などの単独アプリや、Logic ProなどのDAWに組み込まれている例もあります。AI作曲サービスでもSonautoは早くから実装していました。
無料ソフトのUVR5では、ボーカル、ドラム、ベース、その他の4種類に分離でき、Logic ProのStem Splitterも同様。Sonautoも同じです。
■Sunoのステム分離機能はボーカルとそれ以外
Sunoのステム分離はそれに比べると単純で、ボーカルとその他を分けるだけ。つまり、ボーカルキャンセルと同じことなのですが、それなりに使い道はあります。
例えば、AIで作った曲のボーカルを自分や他の誰かが歌う。ボーカルで間違っているところだけを修正する。ボーカルトラックを使ってリップシンク動画の元データにする。
HeyGen、Hedra、Runwayといったリップシンク機能を持った動画生成サービスではボーカルのみのデータを重宝しているので、そういった用途には便利です。
試してみました。ちょうど外で雷がゴロゴロ鳴っていたので、そういう曲をまず作りました。
次に、この曲のからGet Stemsを選びます。
すると、ボーカルのみと、インストのみの2つの曲ができます。
では、ボーカルのみを聞いてみましょう。完全ではありませんが、ちゃんと分離はできています。
ビデオの歌詞フィールドが空白になっています。
次に、オケ音源。ボーカルに持って行かれた部分もあり、完全なオケにはなっていないのも他のステム分離ソフトと同様です。内部的に最初からボーカルとそれ以外を分離していたわけではなく、後処理しているものと想定できます。
こちらはカラオケ風にするために、歌詞を入れてみました。表示用の歌詞を修正できる機能「Edit Displayed Lyrics」は有償ユーザーは使えるようになっています。これを使ってみました。
Edit Displayed Lyricsというボタンを押すと、使えます。[Verse]や[Chorus]などは曲ができてしまえば不要なので、そういう時にも使えます。
しかし、Sunoの新機能追加はもうやめて欲しいというのが本音です。書籍の二校を終えたところで修正ですよ……。
■Udioは2分10秒の長尺対応とステム分離
これでひと段落と思っていたら、今度はUdioの大幅機能アップが。また修正ですか。Udioについての記述も全面的に見直さないと……。
今回のUdioはすごいです。なんと、これまでの32秒から、2分10秒へと、1回の命令で生成できる長さが4倍増。短い曲ならこれで完結できます。Sunoは4分なので、まだまだですが。
音質も改善され、ビデオ生成時のカラオケ歌詞表示もなかなか優れています。なんと文字単位で色が変わっていきます。
そして、ステム分離機能も。UdioはUVR5やLogic Proと同様の4パート(ボーカル、ベース、ドラム、その他)のWAVファイルを出力できます。
J-POPのバラードも作ってみましたが、ボーカル、演奏の生っぽさといい、せつなさといい、これはもう人間の歌ですよね。
さらに面白いのが、過去曲のシード値を参照して新たに曲を作れるということ。気に入っていた曲のシード値を使って生成してみました。
元曲はこちら。
それが、こうなります。
もう1曲。
歌詞は出鱈目に歌ってるんだけど、パッションはある歌い方です。これも同じシード値。
英語の曲も同じシード値からできました。
このほかにも、生成するクリップが全体のどの位置からスタートするのかというClip、歌詞が(歌唱部分が)どのタイミングで始まるのかを設定できるパラメータも追加されています。
新機能が多すぎてなかなか全貌を伝えられませんが、Sunoのライバルとして大きく成長しただけでなく、人間のミュージシャンのソングライティングの助けにもなりそうです。
最後に、同じシード値の曲を1つのアルバムにまとめてみました。名もなきAIシンガーソングライターのファーストアルバムです。