ニュース

ヤマハ、AI歌声合成の試作プラグイン。「合成音声の常識を打ち破る」

AIを活用した歌声合成のプラグイン「VX-β」編集画面

ヤマハは、AIを活用した歌声合成の実証実験を8月22日よりスタートした。音楽制作ソフト(DAW)上で歌声合成を可能にする試作プラグインをクリエイターに提供することで、「従来の歌声合成の常識を覆すような楽曲を生み出してもらい、AI歌唱の新価値を検証する」という。

参加には、事前の申込みが必要。配布可能なライセンス数に限りがあるため、2024年3月31日までの期間内に、キャンペーンページから申し込んだ人を対象に不定期で抽選を行ない、当選した人にVX-βのシリアルコードとダウンロードリンクが提供される。なお、申込みには「Yamaha Music ID」への登録とアンケート回答が必要。

ヤマハは2003年から歌声合成およびその応用ソフトウェアである「VOCALOID」を開発・販売。このソフトを使った“ボカロ曲”は新世代の音楽として全世界のリスナーから支持を集めている。

また音楽制作の現場では、ドラムやストリングスなどの楽器の合成音が当たり前のように使われており、リスナーの多くもそれを当たり前のこととして受け入れている。同社はVOCALOIDもボカロ曲の制作に留まらず、クリエイターにとってボーカル(歌声)を合成するための「当たり前の道具(楽器)」になる可能性を秘めていると考えているという。

またヤマハは歌声合成技術の進化を求めて研究を続けており、さまざまな技術試作を行なっているが、その試作も社内にとどまっている限り、その真価が見出されることはないと判断。そこで合成音声の常識を打ち破ることを目的とする研究スタジオ「VOCALOID β-STUDIO」を立ち上げ、初めての試みとして、技術試作であるAI歌声合成のプラグイン「VX-β」の一般公開を決めた。

このプラグインは、ヤマハのグループ会社であるSteinberg Media Technologies GmbHのDAWソフトウェア「Cubase」にて、歌詞やメロディの制作から歌声の作り込みまで、すべての制作プロセスがCubaseのエディター上で完結するように開発されているため、これまでのようにCubaseのエディターと、Cubaseで開いているバーチャルボーカルソフト専用エディターを行き来する必要がなくなり、スムーズな楽曲制作を実現する。

Cubase以外のDAWソフトでもVX-βを使用でき、歌声の基となるシーケンスデータを読み込ませることで、DAWソフト上で編集できる。なお、DAWでの歌詞・メロディの制作、修正ができるのはCubaseのみ。

VX-βには、任意のボイスバンクから選択できるAIシンガーの表現力を最大限に発揮させるというパラメーター「Powerノブ」も搭載。声の張りや息の混ぜ方、発音のアクセント、ビブラートといった歌唱表現に関わる要素をAIがまとめて変化させ、音楽的な音の強弱をAIシンガーの歌声に反映させるもので、Powerノブの操作により複雑な歌唱表現を生み出せるという。

また歌声のパラメーター変化に歌声合成エンジンがリアルタイムに応えるため、パラメーター操作に歌声が即座に変化することから、「AIシンガーが歌っているまさにその最中に、歌唱表現のディレクションを与えるような体験が可能」とのこと。

9種類のボイスバンクを使用できる

ポップスやジャズ、ロック、アニメなど、さまざまな音楽ジャンルに対応する9種類のボイスバンクを使用可能。それぞれのボイスバンクでは、AIシンガーの声質や歌いまわしが異なる4つの歌唱スタイルを選択でき、ひとりのAIシンガーの歌唱スタイルをシームレスに変更しながら楽曲を制作できる。またボイスバンク「multi-β-N」には17人のAIシンガーを搭載しているため、複数のシンガーをシームレスに切り替えながら制作することも可能。

実証実験にあたり、ヤマハは「クリエイターの解釈による自由な創作により、従来の歌声合成の常識を覆すような作品を生み出してもらいたいと考えています。そして、クリエイターからのフィードバックを元に試作プラグインを改良し、音楽制作において『今までなかった未来の当たり前』となる製品の開発につなげてまいります」としている。

VOCALOID β-STUDIO -コンセプト-