第408回:Y2プロジェクトが取り組む「クラウド型VST」

~ 月額制での低価格化やiPhoneへの可能性も ~


1日に行なわれた「Y2 SPRING 2010」「初音ミクの破片 ~セカイロイド襲来~」で発表された、初音バグ

 既報のとおり、3月1日、ヤマハは「Y2 SPRING 2010」という技術発表会的なイベントを行なった。

 これはヤマハのインターネット関連の研究・開発を行なう「Y2プロジェクト」による発表会で、しゃべるボーカロイド「VOCALOID-flex」、エフェクトやシンセサイザをクラウド上で展開する「クラウド型VST」、初音バグをセカイカメラ上に実現させる「セカイロイド」、ネットを介してリアルタイムセッションを可能にする「NETDUETTO」の、大きく4つの技術やサービスが披露された。

 ただ、発表会では細かなところまで聞くことができなかったため、より具体的なサービス内容や技術背景などをヤマハに追加取材を行なった。今回はそのひとつ、「クラウド型VST」について伺った。


■ 「クラウドを音の世界に展開」

左から宮崎氏、田邑氏、小池氏

 インタビューさせていただいたのは、ヤマハ株式会社サウンドテクノロジー開発センター、ネットビジネスグループのマネージャー、田邑元一氏と同ネットビジネスグループの技術開発担当の主任、小池祐二氏、そしてクラウドでの流通・課金などのサービスを担当するパートナー企業であるビープラッツ株式会社の戦略・技術担当取締役、宮崎琢磨氏の3名(以下敬称略)。

 ちなみに、宮崎氏は以前勤務されていたソニー時代に、バイオにバンドルされていた「SonicStage Mastering Studio」の企画担当者として、このDigital Audio Laboratoryでも2回インタビューしている人物だ。

藤本:まず、Y2プロジェクトとはどんな組織なのかを教えてください。

ネットビジネスグループ 田邑元一マネージャー

田邑:Y2プロジェクトは、2008年1月1日に5人のメンバーで発足したプロジェクトです。「ヤマハの音、音楽技術をインターネットの世界へと広げ、プロから一般ユーザーまで多くの人に最高の音ツールを提供する」というコンセプトでスタートしました。ここでキーとなるのは、われわれが直接ユーザーの方々にサービス提供したり、販売するわけではないことです。ネットベンチャー企業をはじめ、ほかの企業とコラボレーションする形でビジネス展開することを考えています。

 すでに昨年4月、インターネット上で歌声を合成する「NetVOCALOID」という技術を発表していますが、これらはクリプトン・フューチャー・メディアさんの「ミクと歌おう」、インターネットさんの「ケータイがくっぽいど」というサービスとして、また最新の例ではKDDI株式会社さんのiida calling3キャンペーンで、ヤマハが前面に立たない形で提供しています。

藤本:そのY2プロジェクトで、今回の「クラウド型VST」に取り組むことになったキッカケはどんなことなのでしょうか?

田邑:Y2プロジェクトは発足当初から、メンバーがR&Dの中枢である浜松の北に位置する豊岡工場と、東京に分かれていたため、合同での合宿ミーティングなどを何度か行なっていました。2008年の夏前に行なっていたブレストで出てきたのが「音処理プラットフォームは今後、徐々にネット上に移行していくだろう」という仮説であり、われわれとしてそこにどう取り組んでいくべきかを話し合ったのです。

 将来的にはクラウド上のDAWといったことも考えられそうですが、まず最初の一手を打つなら、得意とするプラットフォームであるVST/VSTiを展開したらどうか、という方向に話が進んでいきました。

藤本:DAWを使っているユーザーからすると、ずいぶん唐突な話のようにも思いますが……。

ビープラッツ 宮崎琢磨氏

宮崎:確かに、現状のユーザーからすると妙に感じる方もいるとは思いますが、すでにビジネスシーンで広く展開されているクラウドを音の世界に展開することで、さまざまなメリットも出てきます。分かりやすい例でいえば、金額の面です。パッケージで購入すると5万円するシステムが、月額800円で利用できるとしたら、導入のハードルは下がるのではないでしょうか?

 また、今すぐに欲しいというプラグインを即利用できるというのも大きなメリットだと思います。メンバーでDAWのデータの受け渡しをしている中、使用されているプラグインが手元になく、曲を正しく再生できないというケースは多々あると思います。でもクラウド上のプラグインを使用していれば、そうした問題も解決できるでしょう。

 さらに自分のシステム環境を汚さないというのもひとつのポイントです。試しにプラグインをインストールしたけど、気に入らなかった場合、従来はそのままにしておくか、アンインストールを行なうわけですが、何度もインストールを繰り返すことによって、システムに不具合が生じることもあります。しかし、クラウドであれば、そうした心配もなくなります。

田邑:さらに、最近はDVD-ROM何枚組といったサンプリング系のシンセサイザも増えていますが、それをインストールするだけで1日作業になってしまいます。でも、クラウド上で利用できるなら、即利用でき、音が気に入らなければ、別のシンセサイザに切り替えるといったことも簡単にできるわけです。

藤本:クラウドでサービスを行なうことによって、DAW以外でのVSTプラグインの用途というのも出てきそうですよね?

田邑:はい、実際にはそちらのほうが大きなニーズがあり、新たな展開ができるのではないかと考えています。DAW以外にもPC上であれば、Flashで使えるプラグインであったり、iPhoneやAndoroidで利用できるプラグインという利用法も有効だと思います。たとえばFlashを使った、さまざまな音楽コンテンツが存在しますが、FlashにはMIDIもインプリされていないし、エフェクトのプラグインという機能もありません。そこで、クラウド型VSTをFLASHから呼べるようにしてあげれば、さまざまな展開が可能になると思うのです。

Y2プロジェクトを介してサービスを利用

 同様に、iPhone上にも楽器アプリケーション、レコーディングソフトなど、さまざまな音楽アプリケーションが急速に増えてきています。しかし、ここにはプラグインの規格が存在しないため、たとえばEQ、ディレイ、リバーブといったエフェクトを使いたい場合に、現在は1つずつ専用のプログラムを組んでいく必要があります。しかし、クラウドでエフェクトが使えるのであれば、開発の手間も省くことができ、簡単に組み込むことができるわけです。まだ、断言はできませんが、アップルから発表されているiPadなどがクラウド型VST利用の起爆剤になるのではと期待しているところです。



■ クラウド型VSTへのアクセスツール「Plugin Dock」

藤本:2008年の夏前の合宿でアイディアが出てきたとのことですが、その後開発はどのように進んでいったのでしょうか?

ネットビジネスグループ 小池祐二主任

小池:VSTとなると、オーディオをストリーミングによって、クライアントからホストへ流し、それをホスト上でプロセシングして、再度クライアントへストリーミングで流すという形になります。このようなストリーミングの前にファイルベースでやりとりするシステムを、2008年3月にはプロトタイプを作っていました。それに改良を加えていったものを同年9月に発表し、CEATECのブースで展示もしているのです。「Auto Vocoder Box」というブラウザ上のFlashで動作するソフトで、クラウド上でピッチフィックスを行なえるというものになっていました。

藤本:このソフトを見ていなかったのですが、内容を教えていただけますか?

小池:Auto Vocoder Boxはその後も1年間、Y2プロジェクトのホームページにおいて、無償公開していました。すでにサービスは終了していますが、これはMIDIによってメロディーを指定し、歌声などのオーディオを指定すると、MIDIのメロディーに補正された形でオーディオが生成されるというものです。この際、ピッチフィックスだけでなく、コンプ、EQ、リバーブといったエフェクトも掛けることが可能で、掛ける順番も自在に選べるようになっていました。

「Auto Vocoder Box」。MIDIによってメロディーを指定し、歌声などのオーディオを指定すると、MIDIのメロディーに補正された形でオーディオが生成される

田邑:ただファイル単位だと、どうしてもその先のできることに制限が多くなってしまいます。大きなファイルサイズのデータをアップロード、ダウンロードするのも大変ですし、長い曲の途中の一部にちょっとエフェクトをかけようといっても、面倒な作業になってしまいます。だからこそ、ストリーミングでできるといいね、普通のDAWでそのまま使えたら便利だね、という思いを強めていったのです。

藤本:実際、ストリーミングを使ってリアルタイムにエフェクトをかけるということに対し、技術的には難しくなかったのですか?

小池:こうすればできるだろう、という感触は持っていました。そして実際開発を進めていき、2009年2月にはなんとか動く初期のプロトタイプが完成しました。さらに、ユーザーがプラグインを選択できるようにしたい、パラメータもいじれるようにしたいといった機能追加をしていき、社内にも見せていきました。もちろん、この開発にはクライアント側、サーバー側双方が必要なわけで、それぞれの開発を行なっていきました。

 クライアント側で大きかったのは、どのようにプラグインのパラメータをいじれるようにするか、という点です。パラメータをいじる方法はいろいろあると思います。当初は単に画像を貼り付けて、その画像を切り替えるUIをとっていましたが、これではボタンを動かすことはできても、曲線の描画や波形のモニタリングなどはできません。そこで、それまでのプログラムを一旦すべて捨てて、HTMLとJavaScriptを用いた仕組みに変更したのです。

「Plugin Dock」

藤本:それが、先日見せていただいた、Cubase上で動くクラウド型VSTへのアクセスツールである「Plugin Dock」ですね?

小池:そのとおりです。このPlugin Dockの画面下側はHTMLブラウザになっているのです。具体的にはSafariに使われているオープンソースのHTMLレンダリングエンジン群である「WebKit」を採用しました。いくつかの方法を検討しましたが、こうした描画のシステムにおいて独自規格にこだわる必要はありませんから、WebKitを採用したわけです。これであればiPhoneなどのモバイル系でもほぼそのまま動かすことが可能なことも大きなメリットだと思います。

Plugin Dockの画面下側はHTMLブラウザになっている

藤本:サーバー側のほうはいかがですか?

小池:サーバー側は当初、とても単純な仕組みになっており、データを受け取って、処理し、送り返すというだけのものでした。ただ、本サービスに向けて考えると、ユーザー管理をしたり、大量なアクセスに対して負荷分散を可能にするなど、VST処理をするサーバーの周りに中間のコンポーネントを追加するようにしました。

田邑:実は、そのサーバー用のVSTのプログラムは、既存のVSTのプログラムをバイナリレベルでそのまま使うことができるんです。

藤本:なぜ、そんなことができるのでしょう? かなり不思議にも感じますが。

小池:要するに、このVST処理のサーバーはWindowsベースのものであり、そこでVSTのホストアプリケーションが動作しているわけです。したがって、そのままの形で、既存の資産が利用できるのです。もっとも、パラメータをいじるためのHTMLについてのみ、別途開発する必要がありますが、GUIが不要であれば、そのまま動くはずです。

田邑:Y2プロジェクトとしては、まずこのクラウド型VSTに賛同していただけるベンダーさんを集めることが重要です。そうしたプラグインが集まって、はじめてサービスができるわけですから。このベンダーさんにご協力をいただく中で、既存の資産がそのまま使えるというのは大きなアドバンテージになるはずだと考えております。これまでDAWだけがターゲットであったものが、iPhoneやiPad、Androidなどのプラットフォームへ展開できるとなれば、ベンダーさんのビジネスもリスクなく広げることができるわけですから。

藤本:そういえば、先日のY2 SPRINGのデモでは、クラウド型VSTを使うと約2秒のレイテンシーがあるけれど、ローカルにダウンロードすれば、通常のプラグインと同等の小さいレイテンシーで動作するという話がありました。このダウンロードとは、どういうことなのでしょうか?

小池:サーバー上で処理しているVSTのプログラムをそのままローカルにキャッシュし、Plugin Dock上で動かすだけの話ですから、難しいものではありません。もっとも、実際に課金サービスを開始していった場合、完全にダウンロードできて、そのまま既存のVSTプラグインのように使えるとなると問題も出てくるので、キャッシュという方法をとっているんです。

藤本:WindowsだけでなくMacのDAWからもクラウド型VSTの利用や、ダウンロードというかキャッシュしての利用は可能なのでしょうか?

田邑:クラウドで使う場合は、まったく問題ありません。ただし、ダウンロードで利用する場合、WindowsのバイナリをそのままMacで使うことはできないので、仕組みが必要になります。といってもサーバー側にMacのバイナリも置くだけのことですから、難しくはないでしょう。同様に、iPhone用のバイナリやAndroid用のバイナリなども置くことで、各種環境においても、レイテンシーを小さくして使うことが可能になるわけです。

藤本:もちろん、クラウド型VSTを利用できるのがSteinbergのCubaseのみということはないですよね?

小池:はい、Plugin Dockは通常のVSTですから、ほかのDAWや波形編集ソフトから使うことも可能です。このY2プロジェクト、予算が少なくて、なかなか他社のDAWを購入して試すことができないのですが、Music Studio ProducerやREAPERなどのオンラインソフトでは動作チェックをしています。もっとも、まだ動作が不安定であったりするなど、どのDAWでも間違いなく動作するという状況にはないのですが、少なくとも他社製品で動作しないようなプロテクトをかけるといったことはしていません。


■ 決済プラットフォームを用意するビープラッツ

藤本:クラウド型VSTは通常のVSTやVSTiと完全互換であると考えていいのでしょうか?

小池:将来的にはVST3対応にしたいと考えておりますが、現在のところVST2対応です。そのVST2としての機能はすべて搭載していますが、さらに機能拡張も図っています。たとえば、ネット接続する際の帯域が狭くなった際、ストリーミングが途切れてしまいます。そのためデータの到着が遅れた場合どうするかといったAPIも組み込んであるのです。もちろん、これらはオプションなので、これら拡張APIを使わなくても大丈夫です。

藤本:ところで、宮崎さんの会社、ビープラッツがクラウド型VSTとどのような関係にあるのか、よく分からないので、簡単に説明いただけますか?

宮崎:ビジネスにおけるIT業界ではクラウドはすでに立派な商品、サービスとして成り立っています。ただ、海外のクラウドのサービスでクレジットカード課金による直販を指向しているものは、紙・口座ベースで流通・販社での流通が中心である日本の法人向けIT市場で必ずしも成功しているとはいえません。

 そこで、当社は決済・流通プラットフォームを用意して、クラウドを日本の企業に効率的に流通させるという業務を行なっています。これをY2プロジェクトのクラウド型VSTにも当てはめようというわけなのです。つまり、ユーザーに月額300円のサービスを提供するとか、ベンダーにその料金を支払うといった仕組みを即実現できるようにしています。

 DAW用のプラグインとして提供する場合でも、モバイル向けサービスとして提供する場合でも、決済・流通システムはすぐに用意できるので、スムーズにサービスがスタートできるだろうと考えております。

ビープラッツは決済・流通プラットフォームを用意

藤本:ユーザーとして気になるのは、これがいつどのような形でスタートするかということですが、具体的なスケジュールは決まっているのですか?

田邑:まずはベンダーさんが集まらないことには始まらないので、スタート時期はベンダーさんが集まり、プラグインが揃ってからということになりますが、できるだけ早く立ち上げたいと思っています。ただ、そのサービススタートの仕方がDAWからなのかは、まだ議論しているところです。それこそ、iPadなどからスタートできれば、既存のプラグインビジネスと競合することなく、始めることができますから。いずれにせよ、ヤマハが直接、エンドユーザー向けにサービスを開始するということはないのですが、予定がハッキリしてきたら、また改めてお伝えしたいと思います。


(2010年 3月 8日)

= 藤本健 =リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。
著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。また、アサヒコムでオーディオステーションの連載。All Aboutでは、DTM・デジタルレコーディング担当ガイドも務めている。

[Text by藤本健]