バンドとしてレコードデビューを果たしたのが1962年。解散を発表したのが1970年。その間にポピュラーミュージックを決定的に変えたロックグループ、ザ・ビートルズ。彼らの音楽が解散して半世紀以上経つのにいまだに世の中に受け入れられ、聴かれている理由は何か、と問われれば、音楽自体の素晴らしさもありますが、「その時代の最先端の技術を以て作り直しているから」だと考えます。
そんなビートルズの「新曲」の制作ドキュメンタリーが11月2日早朝に公開されました。4分8秒のフル楽曲は午後11時に聞けるようになっています。ここでは、その制作過程でどんなことが行われていたのかをまとめてみようと思います。
ビートルズはレコーディング技術の最先端を行っていました。潤沢な資金と、ツアーをやめたことによる時間、レコーディング知識に長けたプロデューサー(ジョージ・マーティン)、ビートル達が要求するサウンドを新しいアイデアで実現するイノベーティブなエンジニア(ジェフ・エメリック)らによって、サウンドの変革が始まります。
テープの逆回転や倍速、ギターやボーカルへのレズリースピーカー使用など、エフェクトを多用した次のアルバム「リボルバー」で、革命的なサウンドとなった1966年に何が起きていたかは、先日出たばかりの書籍「ビートルズ'66」を読むとわかります。
1970年に解散したビートルズ、レコーディングされたけれども非公開だった曲の大半は、レアトラックスやデモを集めた「アンソロジー」にまとめられました。このときに、1980年にこの世を去ったジョン・レノン以外の3人が集まり、ジェフ・リンのプロデュースにより、ジョン・レノンがソロで残していた曲を肉付けして完成させるというスタイルで、「フリー・アズ・ア・バード」「リアル・ラブ」の2曲を公開しました。この2曲は、ジョンが弾くピアノとドラムマシンのサウンドが残ったまま、残りのビートル達のサウンドを重ねたものです。ポールが不足するメロディーを書き上げて追加したこともあり、この時代においては最高の出来栄えの「ビートルズ再結成」でした。
では、「最後の新曲」はどのように誕生したのかについて、11月2日にYouTubeで公開された公式ドキュメンタリーから読み解きましょう。
公式ドキュメンタリーからわかる、音源分離の技術
まず、今回の新曲「ナウ・アンド・ゼン」(Now And Then)は、ヨーコがポールに渡したデモカセットテープに録音されていた曲の一つをベースにしています。これは、アンソロジーのセッションのときに、他の2曲と同様にビートルズとして完成させることを検討していたのですが、ピアノの音が大きすぎて、ジョンのボーカルが聴き取れない。ジョンのボーカルの音量を上げるとピアノが不自然にデカくなってしまう。そのために、この時点ではこの曲に取り組むのをやめる判断をしました。ネットに公開されている非公式音源を聴くと、なるほどこのままでは、というバランスの悪さです。
「フリー・アズ・ア・バード」では、ジョンのボーカルにポールが同じメロディーを重ねることで補強し、曲の形にできましたが、これはどうか。
つまり、この曲を世に出せる形にするには、「ボーカル分離」をやらなければならないということになります。ポールはドキュメンタリーの中で、「当時は分離するための技術がなかった」と述懐しています。「ジョンの声がピアノで曇らされてしまう」。残された時間も少なく、この曲の完成は諦めることになります。そして2001年、ジョージが亡くなります。
1995年と現代の違いは、ここに機械学習で得られた技術を使えるということにあります。
ドキュメンタリー映画「レット・イット・ビー」に使われた膨大なフィルムを再構成したピーター・ジャクソン監督は、デジタル技術を使って映像、サウンドを復元する技術に長けていました。ジャクソン監督自身がというわけではなく、WETA Digitalという彼の会社がその技術を持っていて、それで白羽の矢が立ったのです。
ジャクソン監督は、オリジナルのカセットからトラックを取り出し、機械学習技術によって音源を分離します。この場合は、ピアノの伴奏を除去し、ジョンのボーカルを取り出します。
▲ジョン・レノンのデモ曲が収録されたオリジナルのカセット
「2、3秒すると、非常に鮮明(クリスタルクリア)なジョンの声が聴こえてきたんだよ!」とポール。
▲上の2つのトラックはジョンのボーカルだけに分離されている
ボーカルとピアノを分離し、適切なバランスにできたことで、ポールはベースを入れることができるようになります。
「ベースが入ったファイルを自分のところに送ってきて、それにドラムを入れたのさ」とリンゴ。
さらに、ビートルズの名曲で使われた弦楽器も導入します。ただ、このときにはオーケストラの演奏者達に、これがビートルズの新曲用だとは告げていないそうです。そこから漏れるかもしれないからでしょうか。
ジョージは、1995年のレコーディングで残されていたリズムギターで参加。スライドギターでのソロは、ポールがジョージ風に弾いているそうです。そういえば、ビートルズでもポールがギターソロを弾く曲は何曲もありますね。タックスマンとか。
それをミックスしたら、「これはビートルズのレコードだ」と言えるものになったとポールは言います。
もともとはジョンのソロだった「ナウ・アンド・ゼン」ですが、ビートルズ版は、ジョン、ポール、ジョージ、リンゴの4人の共作としてクレジットされています。
音源分離が可能になったことで、これまでは録音時にトラック数の制限から楽器ごとにトラックが分かれておらず、そのために不可能だった、空間オーディオへの対応も可能になるでしょう。
分離機能は今や、誰でも使える
ところで、2022年の時点ではピーター・ジャクソン監督が率いるチームに頼らざるを得なかった音源分離機能は、今では誰でも使えます。もちろん品質の優劣はあるでしょうが、この分野ではAI技術の進歩により多数のソフトが出ています。
代表的なものは、MetaのDemucsです。オープンソースで、ミックスされたオーディオデータから、ボーカル、ドラム、ベース、その他の4つのファイルに分離してくれます。
ボーカルだけを抽出するものもポピュラーです。筆者が妻の歌声を再現するのに使っているRVCというAI音声変換ソフトには、UVR5という別のボーカル分離技術が組み込まれています。
筆者はこの技術を使って、40年前のバンド演奏を録音したカセットテープから、妻の歌声を取り出すことができました。これも今回のビートルズの手法と同じように、他のパートのリファインやボーカルのピッチ調整など、ビートルズ最後の新曲に使われたのと基本的に同じことができるようになります。さらに、抽出したボーカルデータを学習に追加することで、妻の歌声を作る出すAIモデルの精度を上げることも可能になるでしょう。
妻の歌声をAIで再現するという筆者の取り組みは、ニュース番組News23で、ビートルズ新曲の報道と組み合わせて取り上げられています。現在公開されているクリップは、版権の制限により、ビートルズのパートをカットして再編集されたものです。
さらに、AIによって音源自体をハイレゾ化する技術も進んでいます。写真や動画を高精細にする技術は数年前から知られていますが、同様の技術をオーディオでも可能にする技術が、ついに普通に使える時代が来ました。AudioSRという音声超解像技術が一部で注目を集めています。
しかし、こうしたAI技術は悪用する例も多く見られます。人気歌手が別の人気歌手の曲を歌うといった勝手音源がネットで人気を集めていますが、そうしたものの大半は、本人の許諾なしに音源を分離してAI学習させたものです。音源分離が容易になったことで、こうした弊害も起きています。今回のビートルズのドキュメンタリーでは、「パパならこういうのは喜んでやっていたと思う」という、ショーン・レノンのコメントも入っていますが、「独立したボーカルトラックを公開していなくても勝手にAI音声を作られる危険性」というのもまた、考慮していかなければならないのが悲しい現実ではあります。