ヤマハは8月22日、新しい歌声合成ツール「VOCALOID β-STUDIO」の参加申込受け付けを開始しました。審査に通ると、DAW(音楽制作ソフト)のプラグインとして使える「VX-β」が提供され、新しいVOCALOID音源を利用した楽曲の制作が可能になります。
ユーザーインタフェースは従来のVOCALOID Editorとは大きく異なり、自然な強弱をつけられるPowerノブなどで歌唱のディレクションを与えることができるようです。パラメータは従来のVOCALOIDとは大きく異なっています。歌詞とメロディーを入力するための独自エディタは持っていないという記述が気になります。
▲ケロケロボイスにするKeroというスライダーも用意されている。UTAUの.ustファイルの読み込みにも対応している
このスクリーンショットでは、ゲキヤクβという音源が見えますが、もともとは、くるくる数字さんによるUTAU音源。このほかに、カゼヒキという音源も提供しています。
DAWと統合された操作も進化している様子。DAWプラグインはVSTとAUに対応しています。Cubaseの場合にはエディタが統合された形で操作できるようで、他のDAWより親和性が高いのは従来のVOCALOIDと同様ですね。
ボイスバンクは9種類。全てプラグインにプリインストールされています。9人の異なるAIシンガーが最初から使えるというわけです。
最初のデモソングは、nagiβとカゼヒキβを使った稲葉曇さんの楽曲。
もう1つ、平田義久さんから作例が出ていました。
協力者には、神調教で知られるMitchie Mさん、sasakure.UKさん、アンメルツPといった初期ボカロシーンからのPの名前も見えます。
VX-βが利用できるのは、シリアルコードが届いてから2024年3月31日までの期間。このプロジェクトは製品として販売することを前提としておらず、先進的ユーザーからのフィードバックをこの期間内に得て、「“未来” の歌声合成の追究を皆様とともに行うために新たに設立した研究スタジオ」としています。
ボカロPという名前が生まれて10数年が過ぎ、一定の評価は得られるようになりましたが、まだ「楽器」として成熟したとは言えない状況。AIを使った歌声合成、歌声変換技術も進んできたとはいえ、ミュージシャンの創造性をどのように反映させるかという点ではまだ伸びる余地があります。プロジェクトチームでは、VX-βを使った作品によってフィードバックを得る計画です。
筆者も申し込んでみましたが、すぐに返事が来るわけではなく、少し時間を置いて審査の上で合否が連絡されるようです。YouTubeやニコニコ動画などで歌声合成作品を投稿した実績が必要で、VOCALOID6 Editorを持っている人は優先される模様。
なお、申し込みは今晩中にやっておいた方が良さげ。
届いたらさっそく試してレポートしてみたいと思います。
追記(8月23日19時)
9人のAIシンガーと書いていましたが、実際に使ってみると(シリアルが送られてきました)、その中の1人であるmultiβ-Nは女声12人、男声5人、合計17人分の声を切り替えられるというトンデモ仕様であることが判明。
つまり、25人分の歌声が使えるということでした……。
このmultiβ-Nの性能を遺憾なく発揮したデモ曲も公開されました。田廻弘志さんによる「交響的狂詩曲いろはうた」。解説記事はこちら。