新連載「AIだけで作った曲を音楽配信する」。生成AIが作り上げた架空バンド「The Midnight Odyssey」を世界デビューさせる、その裏側

テクノロジー AI
山崎潤一郎

音楽制作業とレーベルを運営すると同時にライター活動も行う。プロデューサー、レコーディング・マスタリングエンジニアとしてクラシック音楽を中心に、アルバム制作を数多く手がける。iPhone/iPadアプリ「Pocket Organ C3B3」「The Manetron」等の開発者でもある。

特集

大規模言語モデル(LLM)でコンセプトを考えて、AI作曲サービスでボーカル入り楽曲を作り出す。そんなやり方で制作したコンセプトアルバムを音楽配信に載せるという話を、自ら音楽レーベルを運営し、テクノロジー関連の執筆もこなしている山崎潤一郎さんに、数回にわたって執筆いただきます。



AIが生み出した架空のバンドを世界デビューさせる――そんなプロジェクトを進めています。

松尾公也氏の「音楽の作り方が決定的に変わる。架空のロックバンドのコンセプトアルバムを丸ごとAIで作れてしまいました」という記事には驚かされました。


松尾氏がプロデュース、チャットAIであるChatGPTと作曲AIのSunoによって制作した架空のプログレッシブロックバンド「The Midnight Odyssey」による楽曲の完成度の高さと、それを実現したSunoの可能性に感嘆しました。

「すごいもんだ」と傍観者を決め込んでいた筆者のもとに、松尾氏から件のアルバムをApple Music等のプラットフォームを介して正式に配信したいという連絡が入りました。

筆者は、40年近く音楽制作業に従事しています。2000年代初めに自分の会社を興し2008年からは、iTunes Music Store(当時)に自社制作の楽曲を提供しています。サブスクリプションが主流になった今も、累計で二千数百曲の楽曲を配信しています。

そのような筆者の実績を知っての依頼だと理解しました。また、筆者自身も、生成AIの楽曲をグローバルなプラットフォームにリリースすることでどのような可能性が広がるのかを確かめたい気持ちもあり、協力を約束しました。

AI楽曲に対する各プラットフォームの姿勢は?

本稿では、配信に到る経緯、音源のミックス・マスタリング作業についての様子を報告します。生成AI楽曲に限らず、音楽アルバムがどのようなプロセスで配信に到るのかといった様子もわかると思います。

まず行ったことは、プラットフォーム側が、生成AI楽曲に対してどのような考え方を示しているのかという調査です。昨年、Spotifyが生成AIによる楽曲を大量に削除したことがニュースになったくらいです。事前に調べる必要があります。


ただ、Spotifyについては、生成AIに言及したガイドラインのようなものを確認することができませんでした。筆者が見落としている可能性もあるので、ご存じの方がいたら、ぜひお知らせください。

YouTube Musicについは、先日のカンファレンスにおいて、生成AI楽曲に対する方針が示されました。詳細は本連載において、後日お知らせします。


で、最も気になるのがApple Musicの動向です。Spotifyと並んで最大級のサブスクプラットフォームですから、その影響力を考えると、配信者として大いに注視する必要があります。

Appleの場合、コンテンツ提供者は、まず「Apple Musicスタイルガイド」を確認します。ここには、アーティストや楽曲の名称など、コンテンツ提供者が守るべきAppleが定めたルールが記載されています。ただし、現状は、AIが生成した楽曲についての言及はありません。

架空のアー写に感じる人間味

それならばと、我々のようなインディ系のレーベルと配信プラットフォームをつないでいるディストリビューター(アグリゲーター)にその是非を確認することにしました。

Apple MusicやSpotifyのようなグローバルな配信プラットフォームは、インディ系のレーベルと直接取引はしてくれません。直接取引可能なのは、メジャーレーベルだけです。

弊社は、iTunes Music Storeがオープンした当時から「ライツスケール」というディストリビューターに配信を依頼しています。長い付き合いなので、事前の根回しなしに、唐突に生成AI楽曲を依頼することは、心情的にはばかられます。

▲AppleがiTunes Music Storeをローンチしたときからの公認ディストリビューター。筆者の会社もその頃からのお付き合い

ライツスケールからは、「現状は配信OK。しかし、今後プラットフォーム側の方針が示され、生成AIがNGになった場合は削除する」という条件付きでOKを取り付けました。

アルバムのカバーアートも必要です。3000×3000ピクセルと結構な高解像度の画像を準備しなければなりません。以前は低解像度でもOKでしたが、筆者の記憶が正しければ、AppleがRetinaディスプレー製品を出し始めたタイミングで高解像度画像が求められるようになりました。

アルバムのカバーアートは、松尾氏が生成AIで描いた「いかにもプログレ!」という下記の画像を設定しました。かっこいいですね。筆者はこれを見た瞬間、「Dream Theater」のアルバムを連想しました。

さらに、「アー写」(アーティスト写真)も必要です。架空のバンドではありますが、アー写があることで、たとえそれが生成AIによる成果物であっても、偶像や虚構の中にちょっとした人間味を感じることができます。

▲冒頭で紹介した松尾氏の記事に各メンバーの架空プロフィールが掲載されている。女性ボーカルのリリー・フォードのクリスタルボイスは、アニー・ハズラムを連想する


Live Studio Concert Philadelphia 1997
¥1,000
(価格・在庫状況は記事公開時点のものです)
ANNIE IN WONDERLAND - 不思議の国のアニー
¥2,933
(価格・在庫状況は記事公開時点のものです)

ステム音源を用意してミックスをやり直す

配信に向けての事務的な作業を終えると、次は音源の準備です。Sunoが吐き出す音源は、圧縮音源特有のシュワシュワレロレロといったノイズが乗っています。非可逆処理に起因するノイズなので、ある程度は目をつむるしかありません。Lo-Fiな味と思えばよろしいわけです。

筆者としてはノイズよりも、各パート間のバランスや凹凸を欠いた平坦なレベル感の方が気になります。“素"の音源のままでは、ボーカルやオケの表情がいまひとつです。ただ、Sunoが生成する楽曲は、完パケミックス音源です。バランスを変えたり任意の箇所だけレベルを変えるといった処理ができません。

そこで、松尾氏に依頼して、音源のセパレーションツールを利用して ボーカルやドラムを抽出したステム音源を準備してもらいました。無料アプリの「ULTIMATE VOCAL REMOVER V5」(UVR5)を利用しています。

▲UVR5

これにより(1)ボーカル、(2)ドラムス、(3)ベース、(4)その他の4トラックのステム音源が完成しました。

可能ならギターやシンセサイザーの分離トラックも欲しいところですが、このソフトの処理としては、その他でひとまとめにされています。SteinbergのSpectraLayer Pro 10では、ギターとピアノを独立したステムで分離できますが、4万1800円とかなり高価です。

▲SpectraLayer Pro 10

自らに制約を課した音創り

4トラックのステム音源をステレオミックスする段において、AIが生んだ架空バンドの楽曲というコンセプトを崩さないために「ソフト音源やリアル楽器などの音を加えない」という制約を課しました。

というのは、Logic Proに展開して聴いていくうちに、シンバル、ギター、シンセを新たに加えたいという衝動に駆られます。たとえば、ドラムスのトラックでは「決め」やフィルインの部分でシンバルらしき音が鳴ってはいるのですが、ノイズのような音で、迫力に欠けます。ドラム音源を使ってクラッシュシンバルを入れたい衝動を抑えるのに苦労しました。

そのようにして新たに手弾き等の演奏を加えてしまうと、歯止めが利かなくなりそうで「AIが生んだ~」というコンセプトからどんどん逸脱してしまいます。とはいえ、バランスやレベル調整を行なうだけでは、音楽としての押し出し感が足りず不満が募ります。

そこで、レベル調整以外にも、プラグインを使ったエフェクト処理、波形編集によるトラックの追加や切り出し、といった作業まではOKとします。人間のリアルな録音においても、収録した音源に対するエフェクト処理や波形編集は普通に実施するわけですから、許される範囲でしょう。

AIのボーカルは音程が完璧

次の図はアルバムの3曲目「Through the Storm」のミックス時のLogic Proの画面です。各トラックの黄色い線はオートメーションによるレベル調整です。ドラムスについては、細かく調整しました。

ギターについては、リフの部分だけを切り出して、別トラックに分け、アンプシミュレーターでディストーションの処理を加えています。他には、リバーブ、イコライザー、コンプレッサーなどの処理を行っています。

▲ピークレベルやラウドネスをメーターで確認しながら、3dB程度のヘッドマージンをとってミックスする

ボーカルについては、大まかなレベル補正とディエッサーの処理だけにとどめています。人間のボーカルであれば、Melodyneなどの補正プラグインを利用して、ピッチ、声の強弱、タイミングなどの調整を細かく行う必要がありますが、AIのボーカルは、ある意味完璧な歌唱を行っているので、ほぼそのままです。

この調子でかなりの時間を費やし、アルバム12曲のステレオミックスをバウンスしました。

マスタリングで最終調整を実施し配信する

次に、バウンスが終了した音源を「WaveLab Pro」というマスタリングソフトに読み込んで、最終調整を行います。

通常であれば、この段階でもイコライザー、コンプレッサー、ミッド・サイド処理など様々な作業を行いますが、今回は、各楽曲のレベル感統一、ラウドネス調整、リミッター処理だけにとどめています。

▲アルバムを通して聴いた際、楽曲間でレベルの凹凸を感じないように調整する

通常の音源制作の場合もそうですが、筆者の場合、録音からマスタリング作業に到るまで、各楽曲を数十回、曲によっては100回以上聴き込みながら作業を進めます。もしかしたら、楽曲生成を行った松尾氏よりも多く聴いているかもしれません。

今回の作業は、ステム音源の音質など制約が多い中での作業でしたが、筆者自身とても楽しんで進めることができました。

The Midnight Odysseyのファーストアルバム「The Odyssey of Echoes」は、3月30日からApple MusicSpotifyYouTube MusicAmazon Musicを初めとした主要ストアを通じワールドワイドでリリースされました。

▲左からApple Music、Spotify、YouTube Music、Amazon Music

AIが作った音楽というバイアスを取り除いて聴いても楽曲として普通に楽しめるアルバムに仕上がっていると思います。果たして、星の数ほど存在するサブスク楽曲の大海のなかに埋もれてしまうのか、それとも、一定の評価を受けることができるのか、とても楽しみです。

余談ですが、The Midnight Odysseyのカバーバンドを結成したくなりました。で、そのカバー曲を録音して正式リリースなどしようものなら、現実と虚構の境界線が崩れていくようで、ワクワクするではありませんか。

《山崎潤一郎》

山崎潤一郎

音楽制作業とレーベルを運営すると同時にライター活動も行う。プロデューサー、レコーディング・マスタリングエンジニアとしてクラシック音楽を中心に、アルバム制作を数多く手がける。iPhone/iPadアプリ「Pocket Organ C3B3」「The Manetron」等の開発者でもある。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。