藤本健のDigital Audio Laboratory
863回
ワイヤレスなのに超低遅延1.58ms! 話題の高音質イヤーモニターシステムて何?
2020年8月24日 09:33
今年のInter BEEはオンライン開催のみになってしまったが、昨年のInter BEEで見つけ、これはスゴイと感じたのものがRonkジャパンが開発した“デジタルワイヤレスイヤーモニターシステム”である(第828回参照)。
デジタルでありながら、1.58msecという低レイテンシーを実現しており、Bluetoothでは絶対不可能なリアルタイムモニタリングが可能というものだ。昨年の取材時点ではプロトタイプの展示であったが、先日いよいよ発売され、各方面で話題になっている。
先日、そのデジタルワイヤレスモニターシステムを試すとともに、開発者であるRonkジャパン代表取締役の高山建氏に話を聞くことができたので、どんな技術で実現しているのかを紹介しよう。
96kHz/24bitでワイヤレス伝送できて、超低遅延のモニターシステム
昨年見たプロトタイプとは、レシーバーの形状が少し変わっていたが、日本のベンチャー企業・Ronkジャパンからデジタルワイヤレスイヤーモニターシステム「RWE01S」が発売された。
トランスミッターの「RWE01T」と、レシーバーの「RWE01R」がセットになったもので、実売価格は49,800円前後。単にワイヤレスでオーディオをデジタル伝送するというだけであれば、Bluetooth機器がいくらでもあるわけだが、同システムは一般的なBluetooth機器とは様々な違いがある。
1つ目の違いは、オーディオフォーマット。
Bluetoothの場合、伝送速度に限界があり、44.1kHz/16bitであっても非圧縮のWAVのままでは送ることができず、SBCやAAC、aptXなどのコーデックを使って圧縮している。それに対し、Ronkジャパンのシステムでは96kHz/24bitの非圧縮でそのまま伝送することができ、圧倒的に高音質なのだ。
そして、2つ目の違いがレイテンシー。
一般的なBluetoothのコーデックであるSBCでは、220(±50)msec程度のレイテンシーと言われている。aptXの場合は、よりレイテンシーが小さくなるが、それでも70(±10)msec。さらに、ほぼレイテンシーがないといわれるaptX Low Latencyであっても40msec弱のレイテンシーがある。
テレビやビデオを見る際のリップシンクという意味では40msec以内に収まっていれば違和感はないとは思うが、楽器演奏のモニター用として考えた場合、40msecもあったら話にならない。それに対し、Ronkジャパンのデジタルワイヤレスイヤーモニターシステムは1.58msecとなっており、まさに超低レイテンシー。実質的にレイテンシーがないと言っても間違いないだろう。
中には数字だけを見て、「1msec以下に抑えるべきだ」と注文を付ける方も見かけたが、それは大きな勘違い。
音は空気中を340m/秒で進むため、1msecのレイテンシーとは34cmの距離で音を聴いている状態と同じだ。1.58msecの場合、54cmの距離で音を聴いていることになり、それ以上縮めることに大きな意味はない。たとえば2m離れたところで演奏している音が空気を通じて音が伝搬するのに「2m÷340m/秒=5.88msec」の時間がかかるのだから、レイテンシーが1.58msecのモニターシステムで聴いたら、実際の音よりも先に音が耳に届くという珍現象が起きてしまうほどなのだ。
3つ目の違いは1:nでの接続が可能であるということ。
先日Bluetoothでも「Bluetooth LE Audio」という規格が発表され、1:nでの伝送が可能になったが、まだ実際の製品は出ていない。それに対し、こちらはすでに実現済み。RWE01Sはトランスミッターとレシーバーが1つずつだが、レシーバー単体を追加購入することで増やしていくことができる。
それ以外にも、2つの周波数の電波を組み合わせて、音が途切れないような工夫がされていたり、最大16チャンネルの切り替えの対応し、もしほかの電波と競合した場合は切り替え可能など様々な違いがある。ちなみに周波数帯としては、BluetoothやWi-Fiなどと同様の2.4GHz帯。もちろん、電波法認証(技適)取得済なので、免許など不要で運用できる。
実際に機材を見てみると、トランスミッターのほうはACアダプター接続であるのに対し、レシーバーのほうは単3電池×2本で動作する。
トランスミッター側の入力はTRSフォンのステレオで、Rチャンネルのみに接続した場合はモノラルでの伝送が行なえる。レシーバー側は3.5mmの出力が用意されているので、イヤフォンまたはヘッドフォンを接続して使う形だ。またレシーバーのカバーとなるベルトクリップも標準で付属しているため、身に着けてモニターすることも可能となっている。
製品出荷時にペアリング済みであるため電源を入れれば、すぐに使うことができ、難しさは一切ない。SYSTEM IDと書かれたロータリースイッチでチャンネルを切り替えた場合、それを有効にするべく一度電源を入れなおす必要があるが、特にペアリングのし直しなどは不要なので、とにかく簡単だ。
スペック上、伝送距離は30m程度とのことだが、屋外で試してみたところ50m近くまで飛ばすことができた。ただし、壁などが無く、まったく反射がない屋外環境だとトランスミッターとレシーバーの間に人が入ると音が途切れやすくなるのは2.4GHz帯の特性ともいえるところだ。
超低遅延の秘密とは? Ronkジャパンの高山代表に話を訊く
Ronkジャパンのデジタルワイヤレスイヤーモニターシステムだが、使っている限りはあまりにもシンプル過ぎて、音がいいこと、レイテンシーが小さいということ以外、技術的なことは全く分からない。そこで、開発者である高山氏に技術的内容は会社のバックグラウンドなどいろいろとインタビューしてみた。
ーーRonkジャパンは2006年設立とのことですが、高山さんはもともとどんなことをされてきたのでしょう。
高山:横河電機やケンウッド、日本マランツ、沖電気など、大手メーカーの社員エンジニアとして働いていました。技術分野的には最初は生産技術、その後はオーディオと無線という分野での開発に従事してきました。その後、独立する形で2006年にこの会社を作りました。
ーーRonkジャパンがある「さがみはら産業創造センター」には、初めて来ました。様々な企業が入っている場所のようですが、ここはどのような場所なのでしょうか。
高山:いわゆるインキュベーションセンターで、主にIT系ベンチャーが数多く集まっている施設です。2006年の設立当時、神奈川県内で場所を探していました。県内にあったインキュベーションセンターが、川崎にあるKSP(かながわサイエンスパーク)とさがみはら産業創造センターでした。
橋本にあるさがみはら産業創造センターのほうが入居しやすかったことから、ここを選びました。当初は非常に安い家賃でしたが、5年の期限を過ぎて家賃もだいぶ上がりましたが、便利であることから隣の施設に移り、ここで運営しています。
--設立して14年、これまでどんな製品の開発をされてきたのでしょう。
高山:一貫して“デジタルワイヤレス”カテゴリーの製品を開発してきました。主力製品としては業務用のカラオケマイクシステムである5GHz帯のデジタルコードレスマイクロホンやデジタルワイヤレスインターカムシステム、またデジタルワイヤレスガイドシステムなどです。
例えば、銀座・新歌舞伎座のイヤフォンガイドは当社が開発し、納入したもので、演目の音声解説などに用いられています。またUSENのリモコンスピーカーやヤマハのInfoSound送信機など、さまざまなものを作ってきました。
ーー昨年、Inter BEEでお話を伺った際は、開発は中国で行なっているとおっしゃっていたように記憶していますが、Ronkジャパンの技術は中国の技術ということなのですか?
高山:そこは少し誤解があるかもしれません。当社のグループ会社としてRonk上海という中国の会社があり、ここには現在8名のエンジニアがいます。実際、基板の設計や周辺の設計、製造フォローなどは上海で行なっており、今回のデジタルワイヤレスイヤーモニターシステムも上海での開発となります。しかし、コア技術自体は日本で私が開発を行なっており、それを元に上海で基板設計などを行なっています。
ーー生産は上海で行なっているのですか?
高山:基板においては上海で組み上げていますが、それを日本に持ってきた上で、組み立ておよび検査を行なっているので、Made in Japanの製品となります。
--2.4GHz帯を使ったデジタルワイヤレスというと、Bluetoothというのが常識だと思いますが、今回のシステムを開発した背景はどんなことなのでしょうか。
高山:他社がこれまで取り組んできたBluetoothのシステムでは基本的にハンドシェイクを確立した上で送信し、それを受信し、その内容を確認をして……という手順を踏んでいくために、どうしてもレイテンシーが大きくなります。楽器を演奏する際のモニターを考えた際、Bluetoothでは実現不可能なので、まったく異なる考え方のシステムを作ってみたのです。
ーー2.4GHz対応を使いつつも、Bluetoothは使わず、独自仕様ということですね。もう少し具体的に教えてください。
高山:ここではBluetoothのようなハンドシェイクはしません。つまり受信側の反応は見ずに、流しっぱなしにするのです。ただ、これだとデータの取りこぼしが生じると音切れしてしまいます。データ自体はある程度をまとめてパケットで送るのですが、取りこぼしがあることを前提に、パケット内にエラー訂正情報も一緒に送ります。
一方の受信側は受け取ったパケットを分析した上で、エラーが起こっていたらそれを訂正し、回復させた上で使うのです。こういう方式にすることで大きく2つのメリットがあります。一つはハンドシェイクせずに済むため、レイテンシーを極めて小さく抑えることができます。そして、1:nでの通信を簡単に実現できるわけです。
ーーレイテンシーが1.58msとのことですが、これは理論値ですか? それとも実測値ですか?
高山:理論上も、実測上も1.58msです。オシロスコープで見ても入力と出力での差が1.58msとなっているのがお分かり頂けます。また内部的にはデジタルtoデジタルの変換もしていますが、ここでの遅延は600μsなので、ほぼ無視できるものとなっています。
ーー1パケットのデータ量ってどのくらいなのでしょう。
高山:1つのパケットはL/Rセットにした8つのサンプルを入れており、そのパケットを8つ分まとめてブロックの形で送っています。つまり64サンプル分を送っています。たとえば、この8個のうちの2個をロストしても残り6個からエラー訂正を行ない、無くなったデータに近いデータを抽出する仕組みになっています。その意味では100%の音ではないのですが、ほとんど劣化のない音を遅延なく送ることができるのです。
--8つのうちのいくつが届けば大丈夫なのですか?
高山:8つのうち、最悪1つでもあれば、音が途切れることなく、再生することが可能です。さすがに8つともロストすると音が消えてしまいますが、そうした場合でも、ブチッというノイズを発生させないよう、瞬間的にフェードアウトをかける形にしています。
ーー1つのチャンネルで2波を使っているとのことですが、それぞれでまったく同じデータを送っているのでしょうか。
高山:いいえ、最悪でも1つが届くように、2波それぞれで別のデータを少しずつ順番を変える形で送っています。こうすることで、悪条件下においても、まず音が途切れることなく高音質での伝送が可能となっています。
ーーレイテンシーが極めて小さいデジタルでのオーディオ伝送システムというのはあまりないので、プロユーザーからの期待も高まっているようです。
高山:このシステムは今回初めての製品ということもあって、業務用ではなくコンシューマ用という位置づけにしています。飛距離が30m程度ということもって、大きな箱だと届かない可能性もあるからです。今後ユーザーのみなさんからのフィードバックもいただきながら、より多くの方に満足いただける製品に育てていきたいと思っています。