日本を代表するシンガーソングライターであるユーミンこと松任谷由実さんの50周年記念ベストアルバム「ユーミン万歳!」が10月4日に発売されました。中でも話題なのが、過去の自身の歌声とのデュエットを実現していること。
新曲「Call me back」では、現在68歳の松任谷由実さんと、1971年に「ひこうき雲」でデビューしたての荒井由実さんがデュエット。50年前の歌声はAI技術で再現されました。
初回限定盤のみの特典映像「荒井由実×松任谷由実 ダイアローグ」は、荒井由実と、現在の松任谷由実の初の対談を収録。つまり、歌声も話声のどちらもできるということです。
この技術を開発したのは、東京大学 東京大学大学院情報理工学系研究科 猿渡・小山研究室で音声研究を行っている高道慎之介助教を中心とした若手グループ。東京大学が発表しています。高道助教は「Call me back」ミュージックビデオのエンドクレジットで「AI Voice Researcher」として登場しています。
今回使われた技術のポイントは、「複数の音声変換タスクを多段階に学習する機械学習と、これまで蓄積してきたデータベースおよび編集法により、1970年代~80年代に収録されたわずかな歌声のみからその声色や歌いまわしを現代に対応する音質で新しい楽曲上で再現しました」としています。
過去の歌声からバーチャルシンガーを作り出すにはいくつかの困難なポイントがありますが、その一つは、「音資料の少なさ」です。荒井由実時代のレコーディングは「ひこうき雲」「MISSLIM」「COBALT HOUR」「14番目の月」の4枚のアルバムのみ。ボーカルトラックが残っているとはいえ、その長さは十分ではなく、音声合成に必要な音素のつながりを網羅したものではありません。また、歌声の特徴となる抑揚が機械学習の邪魔になったりもします。
研究グループは、当時の音資料の少なさを補うため、自ら設計し公開した音声コーパスのJSUT・JVSなどを使用したテキスト音声合成によって機械学習を行いました。抑揚による揺らぎについては、データを半自動的に編集・枝刈りする手法を採用し、機械学習しやすくしています。
ミュージシャンの中でもボーカリストは最も加齢に左右されやすいパート。いかに優れたボーカリストといえど、全盛期の声域や声質を60代、70代になっても維持し続けるのはほとんど不可能です。ですが、この技術を使えば、過去の特定の時期のトーンや歌い方で歌唱することが可能になります。
高道助教の研究チームでは、高品質のリアルタイム音声変換技術も発表済み。
最近ではELTの持田香織さんの歌声をライブ変換してカラオケできる「なりきりマイク feat. ELT 持田香織」が、ビッグエコーで期間限定で実施されています(10月11日まで)。こちらはヤマハの技術ですが、歌声の声質変換は、クリムゾンテクノロジーのVoidolなど、複数で開発が行われており、通常の歌唱合成の並ぶ、次の大きな波となっています。
高道助教にリアルタイム変換の可能性を尋ねたところ、「本件の内容は変換速度よりも音質重視ですので,直接のリアルタイム応用は難しいですが,いずれは可能になると思われます」との答えが得られました。
これが実現すれば、たとえば松任谷由実さんが荒井由実の声質でライブパフォーマンスをするといったことも可能になります。初期の楽曲は昔の声で、最近の曲はそのまま、といった声質の使い分けもできそうです。
ただ、こうした松任谷由実と荒井由実の声の使い分けを見事にやってのける「なりきりユーミン」が実在していることを最近知って、驚愕しています。曲は同じく「Call me back」。そしてこの方、梅任谷駿美(シュンミン)さんは男性です。
¥3,850
(価格・在庫状況は記事公開時点のものです)