AI作曲サービスのUdioは5月8日、有料プランを含むサブスクリプションをスタートしました。同時に、生成した楽曲の部分修正を行う「Audio Inpainting」機能を追加しています。
まず、サブスクリプションについて。
3つのサブスクプラン
新しいサブスクリプションでは、Free(無料)、Standard(月額10ドル)、Pro(月額30ドル)の3つのプランから選べるようになります。
有料プランは年払いだと20%お安くなっています。
それぞれのプランの特徴は、
・Free:毎日10クレジットが付与され、毎月100クレジットが別途与えられる。生成は同時に2ストリーム(4曲分)。RemixとExtendは可能
・Standard:毎月1200クレジットで1日あたりの制限なし。生成はFreeよりも優先され、同時に3ストリーム(6曲分)。RemixとExtendに加え、Audio Inpainting、カバーアートのカスタマイズ(アップロード)、ユーザーアバターのカスタマイズ
・Pro:毎月4800クレジットで1日あたりの制限なし。生成はFreeよりも優先され、同時に4ストリーム(8曲分)。RemixとExtendに加え、Audio Inpainting、カバーアートのカスタマイズ(アップロード)、ユーザーアバターのカスタマイズ
▲有料プランはアバター画像を変更できる
▲有料プランならTrack Cover(カバーアート)の画像をローカルからアップロードできるが、これはFreeプランなのでできない
1回の命令で2曲(30秒までのクリップ)が生成されるので、毎回2クレジットを消費することになります。なお、クレジットは追加購入も可能。3ドルで100クレジットを追加できます。
Sunoと似通ったプラン構成ですが、Sunoが商用利用制限で無料と有料の差をつけてきたのに対し、Udioは機能で差別化を図っている感じですね。
Audio Inpaintingによる部分修正
その有料版オンリーの新機能であるAudio Inpaintingを見ていきましょう。
オーディオなのにインペインティングというのはおかしな表現ではあるのですが、画像生成AIで、いったん生成した画像の領域を指定して、その部分だけをプロンプトで生成することをインペインティングと称しており、そのやり方に近いことから、オーディオインペインティングと呼んでいるようです。だったら、Incomposingとかすればいいのにと思います……。
まず、試しにJ-POPのバラードを作ってみます。今回のバージョンアップによるものなのか、タイトルが文字化けするようになっています。
タイトルをクリックして歌詞が表示される詳細画面にし、Inpaintingを選択します。すると、オーディオ領域を選択できる画面が表示されます。スライダーを操作して、修正したい部分を選択します。
▲***で囲ったところが変更可能に
そして、歌詞の中で、修正したい部分を***と***で囲みます。歌詞の読み方を間違えているときにはこうして修正します。
ここには歌詞じゃないものも入れることができるので、(guitar solo) などと入れると、そこがギターソロになったりします。
実際に試してわかったのは、修正したものが日本語の歌詞だとデタラメな日本語になってしまうこと。英語にするとちゃんと歌いなおします。デタラメ日本語は部分修正だけかと思ったら、単なるExtendの時にもかなりの頻度で発生するようになっています。タイトルの文字化けも含め、日本語対応は悪化しており、改善の余地があります。
もう一つ、新機能が追加されています。以前紹介した、context-windowが30秒から2分に拡大されたという、5月1日時点での機能追加を改善したもので、単に2分に拡大するだけだと、楽曲の一貫性は向上するけども、新規性は逆に弱まってしまうという問題に対処できるようになっています。
具体的には、Advanced Controlsスイッチをオンにすると、Context Length(context-windowの長さ)を一律に2分ではなく、1秒から2分10秒まで、1秒単位で変更できます。
試しにContext Lengthを1秒に設定してExtendしたら、全く違う曲調・リズムになってしまいました。使い方によっては複雑な展開を持つ曲を作れそうです。
なお、このAdvanced Controlsは、Freeプランでも使えます。
今回のアップデートでは改善点が多いのですが、日本語歌詞の長い楽曲を作ることが難しくなったのがちと残念ではあります。
実際に試してみましたが、やはりAudio Inpaintingは不安定すぎて、実用的とは言い難いものでした。