第514回:DTMに新たな進化。複数Webブラウザで演奏/同期

~Chromeで弾いて低遅延で連携する「WebMidiLink」とは? ~


 DTM革命が進行中だ。この半年でWebブラウザ上で動作するシンセサイザが劇的に進化してきており、その動きがこの1、2週間でさらに大きく加速している。MIDIシーケンサが動くブラウザ画面を1つ、シンセサイザが動くブラウザ画面を1つ、さらに別種のシンセサイザが動くブラウザ画面をもう1つ開く。ここでMIDIシーケンサを動かすと2つのシンセサイザが同期して演奏されるという世界が実現しているのだ。リンク先のYouTubeのビデオを見ればニュアンスが分かるだろう。

 これは先週発表されたばかりのWebMidiLinkという技術によるもので、国内外のソフトシンセ開発者から注目を集めている。そしてWebMidiLinkを考案したのは日本人であり、それに対応したシンセサイザを開発している日本人もいる。まだ一般ユーザーでこうした動きを察知している人は少ないと思うが、たまたまTwitterを見ていた中、開発者の方々のやりとりを発見して驚いたのだ。

 さっそく彼らにコンタクトを取ってみたところ、すぐに取材させていただくことが実現し、先週金曜日に渦中のお二人にインタビューすることができた。その一人はWebMidiLinkの考案者であるg200kgのハンドルネームで幅広く活躍されている株式会社g200kgの新谷垣内(しんやがいと)達也氏。もう一人はWebブラウザ上のソフトシンセ開発者であり、実はあのクリプトン・フューチャー・メディア株式会社の藍圭介氏だ(以下、敬称略)。


g200kgの新谷垣内達也氏クリプトン・フューチャー・メディアの藍圭介氏

 新谷垣内氏は昨年までJVCケンウッドの研究所で研究開発に携わっていたが、1年前に会社を立ち上げ現在は組み込みソフトウェアなどの開発を行なっている方。藍氏は以前は大手メーカーで宇宙ステーションや人工衛星の開発の仕事をしたり、ネットベンチャーで仕事をした後、初音ミク発売直後にクリプトン・フューチャー・メディアに転職し、企画・マーケティングを担当しているという方。お二人とも、今日のテーマであるWebブラウザ上のシンセサイザの開発などは、本業と無関係ではないけれど、現時点では半分以上趣味という立場のようだ。いま、ここで何が起きているのか、詳しくうかがった。



■ Googleトップページでも使われた、Webブラウザで動くシンセとは?

5月23日にGoogleトップページに現れた、Minimoog風のシンセサイザ

――5月23日、故Robert Moog氏の生誕78年ということで、Googleトップページのロゴ部分に弾くと音が出るMinimoogが現れ、驚いた人も多かったと思います。今回の一連の動きは、Googleの件とも無縁ではないですよね?

新谷垣内:そうですね、Googleはあのとき、ややトリッキーなことをしていましたが、JavaScriptを用いたシンセサイザでした。いま我々が進めているのも、同じようにシンセサイザをJavaScriptで動かすとともに、そうしたシンセサイザやシーケンサを連携動作させるということです。Googleのシンセサイザのときは、藍さんがすぐソースコードをチェックしてましたよね。

藍:GoogleのMinimoogはかなりトリッキーな構造になっていましたが、JavaScriptで音源が作れるようになったのは、昨年からのことなのです。昨年3月にFirefoxでオーディオを扱えるようになり、秋からChromeも対応したからです。それまでは、オーディオの出口がなかったのですが、FirefoxやChromeにオーディオのAPIが搭載されたことにより、実現可能になったのです。

Audiotool

新谷垣内:ユーザー側からは、気づきにくいとは思います。実際、従来からもFLASHやJavaアプレットに対応したシンセサイザは存在していました。代表的なのがAudiotoolですね。ただFLASHでのオーディオ出力はどうしてもレイテンシーが大きくなるし、重くなる。それに対し、JavaScriptなら軽くてテキストエディタで書けてしまうため開発は楽だし、レイテンシーが小さくなる。Webのアプリケーションは流れ的に確実にJavaScriptに動いていますね。

――なるほど、ブラウザにオーディオのAPIが搭載されたというのが大きなキッカケになっているということですね。


Web Audio Synth

藍:そうです。ただ難しいのはFirefoxとChromeではAPIが違うんです。具体的にいうとFirefoxに搭載されているのはAudio DATA APIというもの、Chromeに搭載されているのはWeb Audio APIというものです。FirefoxのAudio DATA APIがローレベルのAPI、つまり単に音を出すだけのためのものなのに対し、Web Audio APIはすぐに使えるモジュールがいろいろ用意されており、それらを組み合わせれば簡単にシンセが作れてしまうのです。私の「Web Audio Synth」は、そうしたモジュールを利用しながらWeb Audio APIを使って作っているので、現在のところChromeでしか動かないんですよ。新谷垣内さんのは、Firefoxでも動きますよね。


Web Modular

新谷垣内:Web Audio APIはコンプやEQ、ディレイ、コンボリューションリバーブ、ディストーション……といろいろなモジュールが用意されていますが、それが気に入らないとどうしようもないという面もあります。私の作った「Web Modular」の場合は、Firefoxでも動かしたかったので、一から作らざるを得なかったんですよ。

藍:新谷垣内さんのソースって、ありとあらゆるものを自分で書いているから、すごいなぁといつも感心しています。

――シンセサイザの性能の評価の仕方というのは、いろいろな角度があると思いますが、たとえば音質という面では8bit/22.05kHz程度なのか、16bit/44.1kHzが扱えるのか……といった面があると思うのですが、ChromeやFirefoxのオーディオAPIの場合どうなるのですか?

新谷垣内:それはブラウザ次第であって、アプリケーション側から投げた結果どうなるかはさまざまですが、たとえばWindows上のChromeやFirefoxでいえば16bit/44.1kHzのステレオが通っていますので、音質的にはそれなりのものが出ています。ただ、仕様は結構変わるので、ここに固定されるのかどうかは分かりません。またオーディオAPIは今後、ほかにも広がっていきそうです。実際、Safariは次のMountain Lionで動くバージョンではChromeと同じWeb Audio APIをサポートするといっており、現在のディベロッパープレビューバージョンでは動いているようですね。

藍:よく、ユーザーの方から「ほかのブラウザにも対応してください」という要望を寄せられるのですが、こればかりはブラウザ側の問題なのでね……。

現在はブラウザ側の仕様によって、利用できる環境が限られる

――確かに、Web Audio Synthをほかのブラウザで使おうとしてもエラーが表示されます。実際のところInternet Explorerではダメなんですか?

新谷垣内:IEはねぇ……。IE10でもできないようですよ。早く対応してくれるといいのですが……。

藍:例のGoogleのMinimoogはIEでも動いたわけですが、あれは一部FLASHを利用していたようです。基本的には音の出口をFLASHに受け渡していただけのようですが…。



■ 発案の翌日にアプリが実現。海外からも対応シンセ登場

――さて、ここからが本題ですが、今回のWebMidiLinkによって各ブラウザ上で起動させたシンセサイザやシーケンサをつなぐことが可能になったわけですよね。

藍:ネットワークを通じてのMIDI信号などの伝送というのは、ずっと多くの人たちが考えてきていました。でも、ネットワーク越しになると、どうしても大きなレイテンシーが生じるし、ドメインをまたいで、ということになるとセキュリティ面でも問題が出てくるため、頭を抱えていました。そんな中登場したWebMidiLinkの発想は、まさに画期的でした。これまで多くの人が夢想しつつ誰もできなかったWeb楽器のアプリ間接続を実現してしまったのですから。これはネット経由のように見えて、実は単なるローカルアプリ間通信なのでシンプルかつ速いというところがミソです。

新谷垣内:このアイディア、先日ふと思いつき、夜9時にブログに書くと同時に、似たようなことをしている人たちにTwitterでポンと投げたんですよ。そうしたら、すぐに食いついてくれて、藍さんも、モハヨナオ(@mohayonao)さんも翌朝には、対応アプリを作ってくれたんですよね。本当にみなさん、仕事が速い(笑)。

藍:あの日は、残業して結構遅くに帰宅したんですよ。でも、あれを見てしまったら、もうやらざるを得ませんでしたよ(笑)。最初見たときは、結構大変な作業なのかな……と思ったのですが、とてもシンプルな構造だっただけに、1時間でできてしまいました。

――7月5日には、たまたまでしょうが、ファミコン音源2A03をエミュレーションするソフトシンセをお二人が同時にリリースされていましたよね。それぞれ違うUIで面白かったです。

新谷垣内:私のがWebBeeper 2A03というもの、藍さんのがBITMAKERというものでしたが、見事に被ってしまいました(笑)。


WebBeeper 2A03BITMAKER

――海外からの対応もありましたよね。

Webitaur

新谷垣内:いつものようにプラグインの情報サイトであるKVR Audioに書いたところ、まだそれほど多くの反響はないのですが、GameSmith氏の「Webitaur」というJavaベースのベースシンセが先日対応してくれました。これからも多くの方が作ってくれると楽しいな、と思っているところです。

――このWebMidiLinkというのは、そもそもどうやってブラウザ同士の通信を行なっているのですか?

新谷垣内:これは、まあ比較的新しい技術で、HTML5の「postMessage」というものを用いています。別にMIDI用に登場したものではなく、AjaxのようなインタラクティブなWebアプリで使われつつあったものなのですが、ここにNote On、Note Off、AllNote OffといったMIDIメッセージを載せて送っているだけですよ。

藍:だからこそ、簡単に対応できたんです。マスター側約20行、スレーブ側約20行の合計40行程度で誰でも実現できてしまうというのは、とてもすごいことですよ。

――WebMidiLinkについて、藍さんの制作された2つ目のビデオを見て驚いたのですが、USB-MIDIキーボードを使って直接新谷垣内さんのWeb Modularを鳴らしていましたよね(YouTubeで再生)。あれはどのようにしているのですか?

藍:あれはJazz-Pluginというものを使っています。Jazz-Pluginも、この5月に発表されたばかりのもので、MIDIデバイスの情報をブラウザに受け渡すためのブリッジソフトです。Windows版、Mac版があり、ほとんどのブラウザに対応しています。先日Twitterを見ていたら、「@aike1000のWeb Audio Synthを改造してMIDIデバイス対応した」という発言が海外であって、ソースコードも公開されていたんですよ。そのやり方をWebMidiLink対応のすべての楽器で使えるように応用しました。Jazz-Pluginをインストールした後、それと組み合わせるページを介すことで使うことができますよ。

――FLASHのシンセサイザなどは、やはり「ブラウザの中の閉じた世界」という印象でしたが、実際に鍵盤で弾けるとなると、まさに現実の世界にやってきたことを実感します。もうひとつ、このビデオではFL Studioからシーケンスコントロールしていましたよね。あれはどのようにしていたのですか?

藍:あれはもうひとつMIDIデバイス同士を橋渡しするためのMIDI Yokeというものを使っています。そうすることで、普通にDAWからコントロールできてしまうんですよ。

――普通にDAWからコントロールできるということは、かなり画期的ですよね。それがなくても、WebMidiLinkのページからであればMMLでコントロールできるわけですが、今後、Webブラウザ上のシーケンスソフトなんていうのが出てくると楽しいですよね。

新谷垣内:そうですね。その辺も検討したいですが、ぜひそんなプログラムを作ってくれる方が登場してほしいですね。

――先ほどの話の中で、MIDIメッセージもNote OnやNote Off、All Note Off程度の対応とのことでしたが、そこは何か制限があるのですか?

新谷垣内:いえ、とくに問題はないので、コントロールチェンジでも何でも送ることは可能ですよ。

藍:まずは、ピッチベンド情報を流せるようにすると、さらにシンセサイザとして使いやすくなりそうですね。



■ 数年後にDAWも実現可能!?

――今後はどんな発展が考えられそうですか?

新谷垣内:まだまだ原始的な状況ですので、発展の方向はいろいろありますよ。現実の世界でいえば30年ほど前、「アナログのモノフォニックシンセをCV/GateでコントロールしていたところにMIDIが登場した」といった段階ではないですかね?

藍:そうですね。だからこそ、Minimoogっぽいシンセサイザを作っただけで、褒められるという状況ですから。ポリフォニックへの発展もそうだし、やることはいろいろあります。これでオーディオが通るようになるとエフェクトが使えるようになるので、楽しくなりそうですね。

――そうなると、DAWも視野に入ってくる、と。

新谷垣内:まあ、いまはMIDIシーケンサのレベルですから、DAWはほど遠いですよ(笑)。でもいずれはそちらの方向に進んでいくことになるでしょうね。まあ、オーディオは実際に試してみないと分からないというのが正直なところですね。

――かなり、画期的なシステムではあるけれど、すぐに実際のレコーディングで用いることができるか、まだ難しそうな気もします。

藍:まだシリアスな現場で使うためには、高い壁があると思います。ただ、その壁も、「遅い」とか、「レイテンシー」、「音質」、「性能が低い」というものに関しては、世の中の進歩によって勝手に改善されていくと思います。だから数年後にはシリアスな世界でも使えるようになるのではないかと予想しています。

新谷垣内:確かに、今すぐは無理だけど、数年後なら十分現実的ですね。ただ、私個人的な思いとしては、シリアスなシーンでの利用可能な音楽ツールを目指すというよりも、もっと別の利用法があるんじゃないかと思っています。音源は簡単に使えるし、ホスト側のアプリを工夫すると、何か面白い世界が作れるのではないか……と考えているところです。もっと多くの人たちで、この世界を構築していくことができたら、と思っているので、ぜひ興味のある方は参加していただけると嬉しいです。

――本日はありがとうございました。


(2012年 7月 9日)

= 藤本健 = リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。
 著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。EPUBマガジン「MAGon」で、「藤本健のDigital Audio Laboratory's Journal」を配信中。Twitterは@kenfujimoto

[Text by藤本健]