サンフランシスコベースのスタートアップ Riffusionが同名のAI作曲サービスのパブリックベータを公開しました。
Riffusionは元々Stable Diffusionの画像から音楽を生成するというちょっと変わったプロジェクトから2年前にスタートしたのですが、それがText to Musicのメインストリームサービスとなって登場。今回は「FUZZ」という新しい生成モデルを使っています。
これがいきなりなかなかの出来。プロンプトに日本語も使えて日本語歌詞の楽曲も生成できて、品質も高いのです。品質で言えばSunoやUdioを一部凌駕しているかもしれません。
完成度が高いのに現在のところ無料で無制限という大盤振る舞いなのです(パブリックベータなので)。
まず、Sunoでよく使っているプロンプトを使ってみました。
J-POP, Japanese lyrcs, female vocalist, emotional, piano, rhodes piano, acoustic guitar, slide guitar, 1973, folk, emotional
生成された2曲のうち1曲は英語歌詞になりましたが、もう1曲は日本語歌詞。どちらの曲も品質が非常に良いです。メロディーラインやコードが通り一遍ではなく、おっと思わせるところがところどころあるところがにくい。
[Verse 1]
図書館の隅で見つけた本に
挟まれた花びら 焦げ茶色に
季節の風に運ばれてきた
何も知らずにページをめくる
[Pre-chorus]
どんな人の記憶だろう
どんな思いに包まれていたの
[Chorus]
知らない誰かの想い
花びらと共に残した
心が温まるような
時を旅するフィルム
[Verse 2]
名前も知らないその人は
どんな夢を見たのだろうか
雨音に耳を傾けながら
感じた季節の変わり目を
[Pre-chorus]
過去に結ばれた瞬間
今の私へと繋がってく
[Chorus]
知らない誰かの想い
花びらと共に残した
心が温まるような
時を旅するフィルム
[Bridge]
遠い昔のささやきが
晴れた空に舞いながら
今も生きてる証
[Final Chorus]
知らない誰かの想い
花びらと共に残した
心が温まるような
時を旅するフィルム
ひょっとしてプロンプトには日本語もいけるかとやってみたら、通りました。
日本語の発音はだいぶ怪しいですが、歌詞への忠実度を調整すれば少しマシになります。
英語曲を日本語プロンプトで生成することもできます。
「ビートルズっぽい60年代サイケデリックロック、ひねくれたコード進行とメロディー」というプロンプトが、「1960s psychedelic rock, Beatles-style, complex chord progressions, twisted melodies」と翻訳されて、見事にそれらしいサウンドの曲に仕上がっています。
こういうのをSunoやUdioでもやりたかったんですが、なかなか思い通りにはいかなかったことが、日本語ですんなりできちゃうあたり、日本のユーザーにも浸透しそうです。
出力フォーマットはMPEG-4 AAC、44100 Hz。データレートは101.84キロビット/秒。ボーカル、ベース、ドラム、その他のSTEM音源も同じフォーマットでダウンロードできます。
生成した楽曲をカバー、修正するのもSunoやUdioと同様にできます。こちらの方が使いやすいかも。
RemixからCover、Extend、Replace、Use Promptが選べます。
オーディオクリップを入力して参照することも可能です。
SunoのシンプルさとUdioの細かい設定の両方のいいとこ取りをしている感じですね。
有料サブスクが始まったら迷わず購読することになりそうです。
ハードロック、プログレッシブロックといった洋楽楽曲のプロンプトも日本語で指定できます。