オープンソースAI作曲ソフト「YuE」にGUIがついた。簡単Windowsインストーラーが2種登場。その影響もAIが深堀り考察した(CloseBox)

テクノロジー AI
松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

香港科技大学などが開発したオープンソースのAI作曲ソフト「YuE」が発表されて数日経ちました。筆者はWindowsでのインストールができずにつまづいたものの、WSL2のLinux環境で実行できるようになりましたが、本家のGitHub情報では使えるまでに一定のスキルは必要なようです。

FALやReplicateといったAI出力サービスにホスティングされているYuEにはWeb UIが搭載されていますがいずれも有料。自分のマシンに手軽にインストールできるようにはなっていないのが実情です。

そんな中、YuEにWindows用のインストーラが2種類登場しました。


■YuE for Windows

まず、本家のブランチとして登場した「YuE for Windows」は、WindowsのPowerShellでインストールが可能になっています。特に問題がなくGradioによるWeb UIまで到達できました。

▲YuE for Windowsの画面

音楽スタイルのキーワードが自動でサジェストされるようになっていて、なかなか良くできています。AIモデルの選択もできるので、日本語の歌詞を歌わせるのには適しています。

■Pinokio版YuE

もう一つの選択肢は、Pinokioです。PinokioはAIのオープンソースソフトをクリックするだけでインストールできる仮想環境。

人気のある、もしくは管理者のCocktail Peanutさんが面白いと思ったソフトはかなりのスピードでユーザーが利用できるようになります。筆者の場合はFLUX.1 [dev]、ComfyUI、MMAudio、Pyramid FlowといったソフトをPinokio経由で使っています。

Windowsだけでなく、macOS、Linuxにも対応していて、「NVIDIA Only」と書かれている、CUDAを必要とするもの以外はだいたいクロスプラットフォームで使えます。中にはMac Onlyのスクリプトのもあって、そちらも重宝しています。

さて、YuEのPinokio版は、2つあって、1つは通常版。音楽スタイルと歌詞を指定して推論するものです。

もう1つは、参照する楽曲を指定し、それに音楽スタイルと歌詞を指定することで、参照元に近い音楽を生成できるというAudio Prompt機能を備えたもの。

▲PinokioのAudio Prompt版YuE

SunoやUdioにもAudio Inputなど同様の機能があります。

では、YuEの場合に何が違うかというと、「制限がない」というところです。

SunoやUdioなどは訴訟を抱えていることもあり、既存の楽曲の参照は弾かれるようになっており、さらにそういった楽曲を使わないように同意を求められます。

歌詞についても既存曲の歌詞を利用することはできず、音楽スタイルにアーティスト名、楽曲名を使うことも制限されています。

音楽を記述するときに、誰々風というタグが使えないのは非常に不自由です。筆者の場合はLLMに「誰々風」を記述するためのプロンプトを書かせて、そこから摘んで使ったりしていますが……。

▲Sunoではアーティスト名を音楽スタイルタグに入れられない

YuEではそうした制限は設けられていないため、自由度が高く、希望する音楽にたどり着くことが容易です。

▲YuEではタグにアーティスト名を使える

YuEのAudio Prompt版では、Sunoと同様に楽曲などのオーディオデータをアップロードして、参照したものを生成できます。SunoやUdioではアップロードするときに音源チェックがされますが、YuEではされません。

YuEの場合はボーカルと演奏を含んだものだけでなく、ボーカルと演奏を別々のファイルで参照することもできます。YuEではこれをAudio Promptと呼んでいます。

そこに音楽スタイルと歌詞を指定できるので、異なる元ネタのマージができるわけです。

Pinokioを使ったインストーラーでは、このICLバージョンを使うことができるので、試してみましたが、オリジナル歌手の特徴が再現でき、参照元の楽曲に近い雰囲気で、メロディーやアレンジが多少異なるものが生成されるのを確認しました。

YuEで生成できる音楽はまだ品質が低いため、このままだと実用的ではありません。しかし、音楽業界が恐れるレベルに達するのはすぐだと予想します。

例えば、別の完成曲を参照させてYuEで生成した楽曲をSunoにAudio Inputで取り込み、それをSunoのCover機能で高品質なものにアップスケールするとこんな感じになります。

元曲のコード進行、メロディーライン、歌詞は残っていませんが、ストリングスアレンジも含め、1960年代後半のサイケデリックポップ風がうまく再現できていて、個人的には非常に好みの曲です。こうした雰囲気の楽曲は60年代、70年代、80年代、90年代にそれぞれありますよね。

筆者がこの辺りが大好物なので、Suno、Udio、Riffusionとこの手の作風を実現しようとしてきましたが、このレベルには到達できませんでした。

ちなみにYuEのAudio Promptで4回、SunoのCover機能では100回以上試行しているので、それなりに手間は掛かっています。

なお、動画には、o3-miniを使って開発した自作ビジュアライザーを活用しています。

なお、YuE for Windows版にもオプションでAudio Promptが可能になっていました。どちらを選んでもいいと思います。

この機能は、「誰それに何を歌わせてみた」みたいなフェイク動画の氾濫を招くことにもなりかねず、利用者の倫理面が問われることになりますが、その一方で創作のための応用範囲は広がることになり、難しい部分を孕みつつも、音楽業界を大きく変えていくことになると思います。

なお、こうした機能を備えたAI作曲ソフトが音楽業界にどのような影響を与えるかについて、OpenAI deep researchに調査を依頼しました。

なお、調査対象文献にはこの連載記事も含まれていました(笑)


■AI作曲サービスが音楽業界に与える影響と展望

1. 収益モデルへの影響

● 音楽の供給過多と収益圧迫: AIによる大量の楽曲生成により、市場が楽曲の供給過多に陥る懸念があります。メジャーレーベルは訴状の中で「AI生成コンテンツが市場を飽和させ、人間の創作した音楽を押し流し価値を低下させる」と警告しています。実際、AI音楽アプリ「Boomy」のユーザーは既に1,440万曲以上を生成しており、これは世界の録音音源の約13.7%に相当する規模だと報じられています。こうした楽曲数の爆発的増加は、一曲あたりのストリーミング収入や版権収入を押し下げ、アーティストや作曲家の収益源を圧迫する可能性があります。

● ストリーミングサービスと“AI楽曲”の収益: ストリーミング各社もAI生成音楽の増加に対応を迫られています。Spotifyのダニエル・エクCEOは**「AIで作られた曲をただちに禁止する予定はない」と明言しつつ、不正利用(例えば他アーティストになりすます行為)は認めない姿勢です。実際問題として、AI楽曲を使ったストリーミング詐欺も発生しています。Spotifyは2023年に、Boomy経由でアップロードされた数万曲を人工的な再生操作(ボットによる再生水増し)の疑いで削除し、該当再生のロイヤルティ支払いを保留しました。さらに2024年には、異常な再生操作が検出されたトラックごとに配信レーベルに追加課金するペナルティ制度を導入し、不正な収益獲得の抑止に乗り出しています。一方で、AI楽曲は著作権者への使用料支払いが発生しない可能性があり、プラットフォーム側にとってはロイヤルティ負担の軽減につながるとの指摘もあります。実際、「SpotifyがAI音楽を流せば、人間のミュージシャンには一切支払われず、訓練用に音楽をマトリックスに流し込んだ誰か(おそらくSpotify自身)が利益を得るだけだ」**との議論も出ています。このように、AI作曲はストリーミング上の収益分配の在り方に新たな課題を投げかけています。

● 著作権ビジネスへの影響: AIによる楽曲生成は現行の著作権制度との齟齬も生んでいます。現状、日本や米国では人間以外が創作した作品に著作権は認められないため、AIのみで作曲された音楽には法的な著作権が発生しません。その結果、純粋なAI作曲による楽曲は著作権管理団体に登録できず、印税収入やライセンス料といったビジネスモデルに乗せにくい状況です。この穴を突くように、企業や個人が既存曲に似せたAI楽曲を作り出し収益化するリスクも指摘されています。2023年にはAI音楽生成サービスが無断で著名曲を学習データに使ったとして、ソニー・ユニバーサル・ワーナーの大手レーベル3社が米国企業SunoとUdioを著作権侵害で提訴しました。訴状では「数十年分の人気楽曲を無断複製してAIに学習させ、極めて大量かつ高速にAI楽曲を生成する行為は、市場に氾濫し人間の作品の価値を損なう」と糾弾されています。レーベル側はこうしたサービスに1曲あたり最大15万ドルの損害賠償を求めるとともに、無許諾の楽曲学習や生成の差止めを要求しています。今後、権利者はAI時代に合わせた新たなライセンススキーム(例えば楽曲データの学習利用に対する許諾契約)を模索する必要に迫られるでしょう。著作権ビジネス全体が、AI時代に即した収益モデルへの再構築を迫られている状況です。

2. アーティストの制作手法の変化

● 作曲・プロデュースにおけるAI活用: AI作曲ツールの進化により、アーティストの創作プロセスには新たな可能性が広がっています。例えば「Suno」や「Udio」のようなサービスではテキストで音楽のスタイルや歌詞を指示するだけで、数秒~数十秒で楽曲のプロトタイプを生成できます。これは制作のスピード革命であり、従来は何日も要した曲の下書き作りが瞬時に行えるようになりました。実際、Sunoは数秒で音源を生み出しアイデア出しや即興試作に適するとされ、Udioは生成に時間をかける分サウンドの質感が緻密でより「音楽的な深み」を追求できると評価されています。このようにAIは曲作りの下支えとなり、クリエイターの発想を拡張するツールとして機能し始めています。

● クリエイターの役割変化とコラボレーション: AIの導入により、従来の「作曲家」「プロデューサー」の役割もシフトしつつあります。人間はAIから提案されたメロディやビートを取捨選択し、方向性を指示するキュレーター的役割を担うようになる、と指摘されています。実際に著名アーティストもこの流れに注目しており、YouTubeのAI音楽実験「Dream Track」に参加するチャーリー・プースは「人間の心と非人間的な知性がコラボすることで生まれる音楽の可能性にワクワクしている。AIは創造性を加速させこそすれ、代替するものではない」と語っています。同様に、チャーリーXCXは「AIが音楽業界をどう変えるか予測しきれないが、創造面でのチャンスを模索したい」と慎重ながら前向きな姿勢を示し、デミ・ロヴァートも「アーティスト自身が未来のAI活用を形作る必要がある」と述べています。こうした発言からも、AIとの協働を前提にクリエイターの役割を再定義する動きが始まっていることがうかがえます。今後は**「AIプロンプトが書ける作曲家」「AIで生み出した素材を編集するプロデューサー」**といった、新しいタイプのクリエイター像が一般化するかもしれません。

● AIとアーティストの具体的な協業事例: 実際にアーティスト自身がAIを積極活用するケースも増えています。米歌手グライムスは自分の声のAIモデルを一般に開放し、ファンが彼女の声で楽曲を作ることを許可する異例の試みに踏み切りました。グライムスは「AIで生成された自身の声の楽曲については収益の50%を制作者と分け合う」と宣言し、実際に200曲以上の「AIグライムス」楽曲がファン主導で制作・公開されています。また、ブラックアイドピーズのwill.i.amは音声AIスタートアップへの出資や、AIを使った楽曲アプリの開発支援を行うなど、業界内でもテクノロジーに明るいプロデューサーを中心にAIとのコラボレーションが活発化しています。さらに、日本においてもボーカロイドの延長線上で、AI歌声と人間アーティストの共演する楽曲が登場し始めています。こうした事例は、**「AI=脅威」ではなく「AI=共創パートナー」**と捉えることで生まれる新たな音楽の形を示しており、今後プロ・アマ問わず広がっていくと予想されます。

3. リスナーの行動変化

● ユーザー自身が作る音楽の台頭: AI作曲の民主化により、リスナーが**「受け手」から「創り手」へと立場を変えつつあります**。専門知識がなくても、誰もが好きなスタイルの音楽を生成し鑑賞できる時代が到来しました。例えば、あるユーザーが「自分好みのチルアウト曲」をAIで作成し、それを日常的に聴くといったケースも増えるかもしれません。実際、前述のBoomyではユーザー自身が生成した楽曲をSpotifyなどに直接配信できる仕組みがあり、世界中のアマチュアが自作のAI音楽を公開・共有するコミュニティが形成されています。こうしたユーザー生成コンテンツ(UGC)の盛り上がりにより、「既製のヒット曲ではなく、自作の音楽を聴く」層の拡大が予想されます。今後半年~1年で、YouTubeやTikTok上でユーザーがAIで作った楽曲がバイラルヒットする事例も現れる可能性があります。

● UGC音楽市場の拡大: リスナー参加型の音楽制作が主流化すれば、音楽のUGC市場が大きく広がります。前述のグライムスのケースでは、ファンが制作した楽曲が商業利用も可能となり、新しいエコシステムを生み出しました。このように、アーティスト公認の下でファンが楽曲を共同創作し収益もシェアするモデルは今後増えていくかもしれません。また、AI作曲に特化したプラットフォーム(例: Slip.stream や Soundraw 等)がUGC楽曲の流通拡大を支えるでしょう。大量のAI楽曲が生まれる一方で、リスナー側では作品の玉石混交が進み、趣味に合った音楽を発掘するためのキュレーションの重要性が増すと考えられます。Spotifyのようなサービスでも、人間制作かAI制作かを識別するタグ付けや、AI楽曲フィルタリング機能の需要が高まる可能性があります(現状SpotifyはAI楽曲自体を禁止していませんが、ユーザー保護のためのガイドライン整備が議論されています)。

● リスナーの嗜好・消費行動の変化: リスナーにとって、AI音楽は当初は物珍しい存在でしたが、徐々にひとつのジャンルとして受容されつつあります。2023年にAIが著名ラッパーの声を再現した楽曲「Heart on My Sleeve」は公開直後に数百万回再生され、リスナーの関心を集めました。今後はAI生成ならではの没入感(例:リスナーのリアルタイムな感情や環境に合わせて曲調が変化するパーソナライズ音楽)を求める動きも出てくるでしょう。一方で、音楽の消費行動において**「本物志向 vs. 仮想志向」の二極化も考えられます。すなわち、「人間が魂を込めて作った曲」に価値を見出す層と、「AIが作った効率的で自分好みのBGM」を好む層に分かれる可能性です。また、AI音楽の氾濫により「本当に聴くに値する曲なのか」を疑うリスナー心理も芽生えています。ある議論では、「聴衆がAIのスパムか人間の作品か判別しにくくなり、アーティストが正真正銘自分の作品だと証明する必要が出てくるだろう」**との指摘もあります。このようにリスナーの信頼形成や嗜好パターンにも変化が起きており、音楽鑑賞の文脈自体がAI時代に合わせて変容していくでしょう。

4. 半年後・1年後の予測

● 法規制や訴訟の進展: 今後半年から1年で、AI作曲を巡る法制度整備が加速すると予想されます。米国ではカリフォルニア州の下院議員アダム・シフが、AIの訓練に使われた著作物を開示することを企業に義務付ける法案を提出しており、2024年後半~2025年にかけて成立の行方が注目されています。また、日本でも著作権法上の課題が議論されており、AI生成物への創作貢献度に応じて人間に権利を認める範囲などガイドライン策定が進む可能性があります。半年後には、前述の米レーベル各社とSuno/Udioの訴訟の審理も進展し、AIモデルへの無断楽曲使用が著作権侵害に当たるか否かについて初期的な司法判断が示されるかもしれません。最悪の場合、差し止め命令によって該当サービスは一時停止を余儀なくされ、業界に大きな衝撃を与えるでしょう。一方で、レーベル側も強硬手段だけでなく建設的解決を模索するとみられ、水面下ではAI開発企業との包括的なライセンス契約交渉が進む可能性があります。1年後には、主要音楽企業とテック企業との間で「AIに既存楽曲を学習させるための契約モデル」や「生成音楽の収益分配スキーム」に関する試験的な合意が発表されているかもしれません。また、欧州連合(EU)におけるAI規制法(AI Act)の動向も注視されており、生成AIの透明性義務や著作権保護ルールが国際的に強化されていく展望です。

● 音楽業界の適応策: レーベル、アーティスト、配信プラットフォーム各者はAI時代に向けた適応策を具体化していくでしょう。まずレーベルは、自社の楽曲カタログをAIに安全に活用するための独自プラットフォームやAPI提供を検討する可能性があります。例えば、権利処理済みの音源だけを使って曲作りができる「公式AI作曲サービス」をレーベル自ら提供し、そこで生成された楽曲については著作権者にも収益が還元されるようなモデルです。実際、音楽大手とテック企業の連携は進み始めており、Googleはユニバーサル・ミュージックと著名アーティストの声をAI生成に利用するためのライセンス交渉を行っていると報じられました(※参考情報)。また、アーティスト側ではAIの積極活用を宣言する動きが増えるでしょう。前述のYouTubeの試みやグライムスのように、自分の分身となるAIボーカルモデルをファンに提供したり、ライブで即興的にAIリミックスを取り入れたりするなど、「AIと共創するアーティスト像」が一般化していく可能性があります。配信プラットフォームも、AI楽曲を巡るガイドラインを整備し透明性を高めるはずです。Spotifyは「パートナー(権利者)と協働しつつイノベーションと保護の両立を図る」方針を示しており、今後は楽曲アップロード時に「AI使用の有無」を申告させる仕組みや、AI生成音楽を検知するアルゴリズムの導入が進むでしょう。半年後には主要ストリーミングサービス各社がAIコンテンツポリシーを相次いで発表し、1年後にはそれらが実装・運用されている見込みです。加えて、業界団体によるAI倫理ガイドライン策定や、クリエイターへのAIリテラシー教育の場も増えていくでしょう。

● AI作曲技術の発展とその影響: 技術面では、今後1年でAI作曲のクオリティとアクセス性がさらに飛躍すると見られます。2024年初頭には既に**「Suno並みの高品質で歌唱もできるオープンソースAI作曲ソフト」として中国発の「YuE」が登場しており、誰でも自宅PCで本格的な歌モノ音楽を生成できるようになりました。半年後には、こうしたオープンソースAIがさらに洗練され、より長尺の楽曲(5分以上)や複雑な構成の音楽も違和感なく作れるようになるでしょう。また、多言語歌唱や特定アーティストの歌声スタイル再現といった機能も向上し、プロの作品と遜色ないAI曲が次々と生み出されると予想されます。1年後には、大衆向けのスマホアプリやDAWプラグインとしてAI作曲機能が標準搭載され、クリエイターのみならず一般リスナーも日常的にAI作曲を楽しむ時代が到来しているかもしれません。技術の発展に伴い、前述した法制度や業界ルール整備も「走る技術に追いつく」形で急務となるでしょう。さらに、ディープフェイクによる著名アーティストの声真似曲などグレーな領域と技術的防御策(ウォーターマーク埋め込みやAI検知システム)**のせめぎ合いも激化している可能性があります。総じて、技術進化が音楽制作の在り方を根底から変えるインパクトは計り知れず、その波に業界がどう適応するかが今後の焦点となります。

● 消費者・リスナーのさらなる変化: 短期的には、AI音楽への一般消費者の抵抗感は徐々に薄れ、コンテンツの一部として受け入れが進むでしょう。半年後にはSpotifyやApple Music上で「AI生成」プレイリストが登場し、話題になるかもしれません。また、ジムや店舗BGM、動画のバックグラウンドミュージックなど実用音楽の領域ではAI曲が急速に浸透し、人がそれと意識せず消費している状況も考えられます。1年後を見据えると、リスナーの中には「お気に入りのAIアーティスト」や「自分専用のカスタム音楽アルバム」を持つ人も出てくるでしょう。例えば、「寝る前に自分の今日の気分でAIが作曲した曲を聴く」といったパーソナルな音楽消費が定着する可能性があります。同時に、人間アーティストの価値再発見も起こりえます。AI音楽が氾濫するほど、「やはり人間の生演奏は違う」と感じてライブコンサートに足を運ぶ動きや、アナログレコード回帰など逆説的トレンドも生まれるかもしれません。いずれにせよ、AI作曲サービスの普及がリスナーの音楽体験を多様化させることは確実であり、その変化の方向性を業界が的確に捉えていくことが重要です。

参考文献: 本レポートは業界動向に関する各種報道を参照して作成しました。などを含む引用箇所に示した情報源は、AI作曲を取り巻く最新の事例や専門家・当事者の発言を伝えるものです。これらの情報を総合し、現在の延長線上での今後半年・1年の展望を考察しています。今後も技術と制度の両面で動きが早いため、最新情報のウォッチが欠かせません。


《松尾公也》

松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。