第410回:ネット経由でセッション、Y2 PROJECTの「NETDUETTO」

~ 開発者にインタビュー。Ustreamで配信なども ~


 ヤマハのインターネット関連の研究・開発を行なう「Y2 PROJECT」。このY2 PROJECTが3月1日、「Y2 SPRING 2010」という技術発表会的なイベントを行ない、大きく4つの技術やサービスを披露した。このうち、クラウド上でVSTプラグインを実現する「クラウド型VST」については、第408回の記事で開発者インタビューで詳細を紹介した。

左から中村氏、原氏、大島氏

 今回はその第二弾として、ネットを介してリアルタイムセッションを可能にする「NETDUETTO(ネットデュエット)」について紹介しよう。

 このNETDUETTOの開発者であるヤマハ株式会社 PA・DMI事業部 技術開発部 システム開発グループ 技師補の原貴洋氏、技術コーディネーターとして携わる同じく技術開発部 要素開発グループ 技師補の中村吉就氏、そしてY2 PROJECTの企画・営業を担当するサウンドテクノロジー開発センター ネットビジネスグループ 技師補の大島治氏の3名に話を伺うとともに、実際にNETDUETTOのアルファ版のテスターとして参加させてもらい、その実力を試した(以下敬称略)。



■ ネットワークを介してセッションを可能にする「NETDUETTO」

 ネットワーク越しに2つもしくは複数の地点を結び、お互いでオーディオのやりとりをしてセッションを行なう、そんな発想は古くからあったし、いろいろな人たちがチャレンジをしてきた。

 古くは、米Rocket Networkが「Studio Center」というサービスを行ない、LogicやCubaseなどのDAWを介してのセッションを実現させるとともに、リットーミュージックが「ASTRO SESSION」という名称でサービスを行なったこともあった。

Y2 SPRING会場でライブを行なったsacra

 そのほかにもDigital Musician、jamLink、eJamming AUDiiOなど、似たコンセプトのサービス、製品はいくつかあるが、どれもヒットする状況には至っていないというのが実情だ。

 そんな中、Y2 PROJECTがNETDUETTOを発表するとともに、Y2 SPRING会場においては、プロミュージシャンのデュオ、sacraがNETDUETTOを利用して、実際にライブを行なった。このライブを見た限りでは、音質やレイテンシーなどの点で、まったく支障のない演奏が行なわれ、見ていてその完璧さには驚かされた。このNETDUETTOどんな技術であり、今後どんな展開がされるのだろうか?



■ 開発者にインタビュー

藤本:NETDUETTO、先日のsacraのライブで見て感激したのですが、開発するに至った背景について教えてください。

ヤマハ PA・DMI事業部 技術開発部 システム開発グループ 技師補の原貴洋氏

:ヤマハのネットワークとの関わりは長く、電子楽器で培ったデジタル信号処理技術の応用からスタートし、ルーター事業は今年で15年目となります。おかげさまで国内でも高い評価をいただいており、日経コンピュータのパートナー満足度調査のネットワーク機器部門では2年連続の1位をいただくまでになっています。

 ネットワークと音楽という関係においてはISDNを使った通信カラオケのシステムや、PA機器においてはデジタルミキサーやオーディオプロセッサなどの設定や調整をネットワーク越しに行なうといったこともしてきました。もちろん、着メロ配信やPC用カラオケサービス、世界初のインターネット接続可能な楽器=エレクトーンに曲データを送るサービス(インターネットダイレクトコネクションサービス)など、いろいろと手がけてきました。こうしたものがNETDUETTOのバックグラウンドとなっています。

大島:より、NETDUETTOに直結するプロジェクトとして披露したのが2005年のWPC EXPOでのステージです。このときは2つのステージをネットワークでつないでセッションを行なったのです。インターネットではなくローカルネットワークではあったものの、大きな注目を集めました。ただし、ここで使われたのはオーディオではなくMIDIを用いたものでした。

 さらに同様のシステムを翌年1月に米国で行われたWinterNAMM 2006でも行っています。これはアナハイムのマリオットホテルとディズニーランドを結んでのセッションでした。

サウンドテクノロジー開発センター ネットビジネスグループ 技師補の大島治氏WinterNAMM 2006での様子

藤本:なるほど、MIDIでのやりとりであれば、5年近く前に完成していたというわけですね。

原:技術的に見てデモができる段階にはなりましたが、問題点もいろいろとありました。確かにMIDIはオーディオと比較するとデータ量は圧倒的に少ないのですが、やはり歌やギターを乗せることができません。またローカルネットワーク、もしくは専用回線を用いるのが基本であり、われわれのデモだからこそ実現できたものでした。

大島:見た目には華やかなステージではあったものの、その裏側は、ここは触れるな、こっちは入るな、とシビアな接続をした通信回線があったわけで、一般の人が触れたり、試してもらえるような代物ではありませんでした。だからこそ、もっと普通の人に使ってもらえるシステムを作っていきたいと考えるようになったのです。

藤本:それが今のNETDUETTOへつながってきているわけですね。

原:その間も紆余曲折がいろいろあったのですが、NETDUETTOのコンセプトは「手軽に使えること」、「さまざまな環境でスケールすること」の2つです。つまり、高価な専用ハードウェアや、専用線などの特別な機材、環境が不要であり、難しい設定がいらないこと。また音楽や機材の専門知識がない人でも、カラオケのデュエット感覚で気軽に使えるようにするということです。

 また、環境が整っている場合には、それに応じた高音質、低遅延で接続ができ、そうでない場合でもそれなりの音質と遅延で接続できるという点も重視しました。プアな環境からリッチな環境まで対応できるものにしたいと考えたのです。

ヤマハ PA・DMI事業部 技術開発部 要素開発グループ 技師補の中村吉就氏

中村:インターネット越しでセッションできるものは、ほかからもいくつかありますが、いずれも上のほう、つまりプロの音楽制作を狙うものであると理解しています。確かに専用ハードなどを作れば低遅延なシステムは可能かもしれませんが、ハードルが高いのも事実です。

 その一方で、Skypeなど通話に特化した音声品質のものもありますが、音楽用と考えると音質、遅延の点で扱いにくいのが実情です。そこでその間を狙いたいというのがNETDUETTOなのです。

藤本:業務用のネットワーク経由でのオーディオ伝送というと、EtherSoundやDante、CobraNet、MADI……といったものがあります。これらと比較してNETDUETTOの特性の違いを挙げるとしたらどうでしょうか?

原:やはりそれらで重要視されているのは「完全性」です。それに対しNETDUETTOでは保障されない伝送路、つまりインターネットを使った通信やさまざまな環境であっても動作することを重視しています。そのため遅延維持のためのサンプルの補正を行なったり、場合によっては音切れが発生する可能性があることをやむなし、としているのです。

中村:そのためレコーディングや、業務用PAには向いていません。ただ、同じ業務用であっても音楽制作過程でのミーティングに用いたり、本番レコーディング前の仮歌用であれば十分に使えるでしょう。もちろん、気軽なカラオケデュエットとして使ったり、ニコニコ動画用などの「歌ってみた」といった用途にはいいと思うのです。

原氏。NETDUETTOのコンセプトに「手軽に使えること」、「さまざまな環境でスケールすること」を挙げる中村氏。NETDUETTOでは、音質と低遅延を考慮したという

■ レイテンシーは「ケース・バイ・ケース」。東京都内なら低遅延

藤本:では、もう少し先日のY2 SPRING 2010でのデモに用いたNETDUETTOのシステムの具体的なことについて教えてください。このNETDUETTOにはどんな機材、ソフトが必要になるのですか?

原:まず、ハードとしてはWindows PCとASIO対応のオーディオインターフェイス、そしてFTTHまたはADSLのインターネット回線があればOK。ソフトのほうは、まだアルファ版という段階ですが、われわれが作ったNETDUETTOがあれば、すべて準備完了です。WindowsはXP、Vista、7で動作します。現在、Mac OS Xへの対応も進めています。回線はFTTHが望ましいのですが、1:1で接続するだけならADSLでも実用可能です。

藤本:先日のプレゼンテーションではインターネット越しでも30msec台のレイテンシーで接続可能という話だったと思います。

中村:国内であれば、その程度の遅延での接続ができます。一方で日本とアメリカというように海外との接続になると、そもそも物理的に距離がはなれていることもあり、遅延はどうしても大きくなってしまいます。

原:どの程度の遅延になるかは、伝送路によって違うため、東京都内であれば低遅延だけど、地方同士となると少し大きくなる傾向にはあります。またプロバイダが同じだと遅延も短くなる場合が多いですね。ただケース・バイ・ケースなので一概には言えません。一方、LAN内での接続であれば18msec(3月1日イベントでの実測値)といった非常に小さな遅延を実現することが可能となります。

NETDUETTOの画面

藤本:NETDUETTOの画面を見ると、比較的単純そうですね? マルチチャンネルのオーディオインターフェイスを接続した場合はどうなるのですか?

原:あくまでもステレオ・イン/ステレオ・アウトという構成なのでマルチチャンネルあっても2チャンネル分しか使えません。一方、1:1での通信に限らず、同時に4人でセッションをすることまで可能となっています。この際、セッションルーム名とパスワードが共通であればサーバーを介して接続できるようになっています。なお、サーバーはあくまでも接続先を知らせるためのものであって、通信が始まったらPear To Pearでの接続となります。

藤本:機能的には単純そうですね。これに録音機能やエフェクトをかけるといった機能はないのですか?

原:NETDUETTO本体にはそうした機能は持たせていません。別途NETDUETTO用のオーディオドライバもあるので、これを介して波形編集ソフトなどに接続すれば録音することは可能です。このNETDUETTOはスタンドアロンのソフトですが、当初はVSTの形で作っていました。ただ、より誰でも簡単に使えるようにとこの形に仕様変更しました。

藤本:個人的にはVST版、ぜひ試してみたいですね。そうすればエフェクトなども自由に扱えるし、そのままDAWへレコーディングすることもできるわけですよね?

大島:今後、みなさんの要望に応じて検討していきたいと思います。もっとも、このスタンドアロンのアルファ版も今年に入ってできたばかりで、2月からごく一部の方々に声をかけさせていただき、テスターとして使っていただいています。今後は、もう少し範囲を広げてベータテストを実施してみたいと考えています。

藤本:将来的なサービスの形は固まっているのでしょうか?

大島:いろいろな可能性がありそうだと思ってはいますが、具体的なサービス形態が固まっているわけではありません。こうしたテストを行なってユーザーの声を機能面、性能面ともに向上させつつ、サービス展開を模索していきたいと思っています。

 ただY2 PROJECTとしては、ユーザーへの直接サービス展開を想定しておらず、サードパーティーと連携した上で進めていきたいので、ぜひ、いいサービスアイディアがあれば、ご連絡いただきたいですね。

藤本:ありがとうございました。


■ NETDUETTOでのセッションをUstreamを用いて放送

 実はこのインタビューを終えた後、アルファ版のテスターのみなさんとの意見交換会・懇親会があるとのことだったので、この会に参加させてもらい、アルファ版のテスターとしても加わった。このミーティングにはミュージシャンを中心とした15人程度の方が集まり、かなり活発な意見が出されていた。

 すでに、NETDUETTOでのセッションをUstreamを用いて放送するといったトライアルも何度か行なわれており、Twitter上でもハッシュタグ#NETDUETTOで見てみると、ライブ情報が流れている。

 3月に入ってから遅ればせながらTwitterをはじめていたので(@kenfujimoto)、Twitterで探していたところ、懇親会に来ていたメンバーによるジャズバンド“VOCALOSSANCE”のNETDUETTOライブが3月21日22:00から開催されるという情報が流れていた。5名のメンバーで構成されるバンドだが、このNETDUETTOライブに参加したのは、ちえさん(ベース)、えびせんさん(ピアノ)、oz_hiroさん(アルトサックス)の3名。これにちえさんがToontrackのSuperior2を使って打ち込んだドラムを加えた4つの楽器の音でのネット・セッションがUstreamを使って生放送で行なわれている。

意見交換会・懇親会の様子Ustreamを使って生放送を実施している

 ドラム以外はNETDUETTOを介した、まさにリアルタイムでのアドリブを含む演奏。まずは、どんな演奏となっているのか、ぜひ聴いてみてほしい。

 

サンプル

chococup.mp3(9.4MB)

confirmation.mp3(7.1MB)

編集部注:編集部では再生環境についての個別のご質問にはお答えいたしかねますのでご了承下さい

 この2曲、ともにMP3の128kbpsとなっていて、音質的にも今ひとつ、と感じられる方もいるとは思うが、これはNETDUETTOで接続した結果をUstreamを使って放送した音。それをオーディオインターフェイスを介して録音し、その後、軽く編集を加えたものなので、どうしても音が劣化してしまっている。

 もし、メンバーの演奏現場で直接レコーディングすれば、ずっとキレイな音で録れたとは思うが、ここでは演奏のタイミングなどをぜひチェックしていただきたい。少なくともギャラリーとしてUstreamを聴いていた(オーディオのみでビデオはオフ状態だった)分には、それがネット越しのセッションであるとは信じられないほどのものだった。

 これらの曲、聴いていて気付くのが、時々入る拍手。実はこれ、メンバーのちえさんのプログラミングにより、ギャラリーがチャットで「888」と入力すると、それをリアルタイムにキャッチして拍手を鳴らすようにしたもの。このライブの後、さらに機能強化され口笛を鳴らしたり、笑い声までいられるとともに、即時応答するシステムへと発展していっている。

 演奏後、バンドメンバーにチャットやメールを通じて、話を伺ったのだが、えびせんさんによれば、「レイテンシーはまったく感じずに演奏できました。離れていても誰もが気軽にセッションできるこの技術はとても大きい可能性を秘めていると感じました。自分自身NETDUETTOが普及し、遠く海外にいる友人とのセッションをできることを夢見ています」と話す。

 またoz_hiroさんは「実際のジャムセッションとは違い視覚情報がないため、まったく同じことはやはり難しいですが、純粋に音だけでコミュニケーションができるというのはそれもまた勉強になることがあり、また楽しめました」語ってくれた。

 一方、1曲目の「放課後ちょこかっぷ」の作曲者であり、ドラムの打ち込み、キーボードによるベース演奏を担当したちえさんは「あまり楽器は得意ではないのですが、それでもセッションは楽しく、私程度のレベルだとほぼ実際のセッションと同じ感覚で、まるでそばにメンバーがいるかのように感じることができます」とコメントしている。

 ちなみに、3人はいずれもマンションタイプなどの光回線。またNETDUETTOとの接続に用いたオーディオインターフェイスはALESIS io26 Firewire、FA-66、UA-1Gとバラバラであるが、まったく問題なく接続されている。もっとも、当初、各メンバー同士のパラメータの調整に手間取り、音質が劣化するなどのトラブルもあったが、アルファ版であることを考えれば十分という印象であった。

 なお、VOCALOSSANCEはときどきNETDUETTOを使ったセッションをリアルタイムにUstreamで配信しているので、興味のある方は覗いてみてはいかがだろうか?(http://vocalossance.net/)。


■ 各環境下でのレイテンシーなど、NETDUETTOをテスト

 このようにギャラリーとしてNETDUETTOの面白さを見た後で、自分でも実際に試してみた。まずは、浜松にいる原氏と接続してみたのだが、あまりにもあっけなく接続できて、拍子抜けするほどだった。

 ともに光回線で、筆者のオーディオインターフェイスはRolandのFA-101を、原氏はSteinbergのCI2という環境。とくに何の設定もせずに、オーディオインターフェイスのレイテンシーを小さくした状態で、NETDUETTOを起動し、デフォルトのまま接続したところ、「28msec」という表示。ちなみにこれは筆者のマイクから、原氏の元へ届く時間。反対が30msecと、予想していたよりかなり小さいレイテンシーだ。

原氏はSteinbergの「CI2」でを使用レイテンシーは「28msec」という表示

 別にセッションをしたわけではなかったが、これならかなり快適そうだ。デフォルトでは22.05kHzのモノラル、圧縮というモードだったが、44.1kHzステレオで、非圧縮というモードに変更しても、まったく問題なくやり取りができた。

 ためしに、NETDUETTOで接続しながら別のオーディオインターフェイスを用いてSkype接続してみたところ、かなりのディレイがかかった感じで相手の声が聴こえるのが認識できた。測定はできないが感覚的には200~300msecのディレイという感じだろうか。

 だいぶ以前の記事(DAL241/242)でSkypeの音質について扱ったことがあったが、確かにSkypeでも帯域があればそこそこいい音が出る。しかし、NETDUETTOではASIOが使えるとともにレイテンシーが小さいのが大きな特徴だ。ちなみに画面の28msecという表記の隣にある「9m」という数値は9メートルの距離に相当するという意味だそうだ。

 このインターネット越しのテストの次に、今度は筆者の手元にあるLAN接続された2つのPCを使ったローカルネットワークでのテストも試してみた。前出のマシンはWindows7 Ultimateの32bit版だったが、こちらのマシンはWindows Vista Ultimate。またオーディオインターフェイスにはSteinbergのMR-816csxを使っている。

 このローカルでのテストではFA-101のマシンからMR-816csxのマシンへ伝送する際のレイテンシーは12msec、反対は18msecと、通常に1台のPCでレコーディングする場合とほとんど差がないところまできていた。もっとも、マシンや通信環境によって、この値はいろいろ変わってくるので、この数値を保障するものではないが、簡単にこれだけのレイテンシーを実現できたのは、やはり驚きだ。

FA-101からMR-816csxへ伝送する際のレイテンシーは12msec反対は18msec

 

ドライバをインストールすることにより、ほかのアプリケーションからはNETDUETTOの出力がオーディオ入力として扱えるようになる

 なお、このNETDUETTO単体で動かしている限りは、ネット上でセッションした音はNETDUETTO上のフェーダーなどを利用して、音量調整して手元にモニター環境から音を出すことは可能だが、直接録音したり、Ustreamで配信することができない。そこで別途、ドライバをインストールすることにより、ほかのアプリケーションからはNETDUETTOの出力がオーディオ入力として扱えるようになる。

 NETDUETTOは今後、ベータ版の配布などを検討しているとの話だったが、ぜひ本サービスに向かって進めていっていただきたい。個人的にはVST版もぜひ試してみたい。



(2010年 3月 29日)

= 藤本健 = リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。
 著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またAll Aboutでは、DTM・デジタルレコーディング担当ガイドも務めている。Twitterは@kenfujimoto

[Text by藤本健]