藤本健のDigital Audio Laboratory

第823回

オーディオの革命!? 小型スピーカーで広い音場の独自技術「Dnote-LR+」を体験

「これはオーディオの革命なのではないか? 」そう思わざるを得ない技術に出会ってしまった。強いて言葉にするなら“飛び出す絵本の音版”とでもいったところだろうか。「やっぱり騙されているのではないか? 」、「あの音源だけの偶然なのではないか? 」そんな思いもあるけれど、とにかく魔法のようなオーディオテクノロジーを体験したのだ。日本のベンチャー企業Trigence Semiconductorが生み出した「Dnote-LR+」という立体音響技術について紹介しよう。

話をうかがった、Trigence Semiconductorの落合興一郎氏(左)、岩村宏氏(右)

“HRTFを使わない”立体音響の仕組み

この連載でも何度か取り上げたことがあるTrigence Semiconductor。同社はコーン紙の貼られたスピーカーユニットのコイル部に届くまですべてデジタルで信号処理し、DACもなければアナログアンプもない、アナログ回路が一切ない完全デジタルスピーカー「Dnote」を開発したメーカー。このDnoteを採用したUSBスピーカーであるJDSoundの「ovo」は、高音質で大音量が出せることもあり、ヒット商品となっている。

TrigenceのDnoteを搭載したJDSound製USBスピーカー「ovo」

先日、そのTrigenceの製品マーケティング部統括部長 落合興一郎氏から「小さなスピーカーシステムで、通常のステレオスピーカーのような音場を作り出す技術ができたので、ぜひ見てもらえないか? 」と、図が添付された形でメールが届いた。

Trigenceの落合氏から届いたメールに添付されていた図

音像を広げる立体音響、バーチャルサラウンド的なものは、何十年も前からいろいろあるので、まあその手のものができたということなのだろうとその時は思ったし、まったく期待もしていなかったのが正直なところだ。ただ、あのDnoteを作ったTrigenceだから、もしかしたら何かがあるのかも……と、軽く話を聞くつもりで出かけた。

対応してくれたのは落合氏と、今回のDnote-LR+なる技術を開発したという、同社の最高技術責任者、岩村宏氏。「説明するだけでは、なかなか分からないでしょうから、まずは音を聴いてみてください」と言われて、小さなスピーカーの前に立った。

小さなスピーカーでデモを体験

そのスピーカーは、ネット通販などでもよく見かけるAnkerのBluetoothスピーカーで、SoundCore 2というもの。最初に聴かされたのは、何の変哲もない普通の音で鳴る、ギターソロが演奏されるロック調の音楽だった。「では、今度はこちらを聴いてみてください」と言われ、同じ音楽が再生されたのを聴いて、度肝を抜かれた。音が出てくるのは、確かにこの赤い小さなスピーカーのはずなのだが、明らかに違うところから音が聴こえてくる。ギターソロは目の前のスピーカーより少し高い位置、左側に20~30cm離れたところから聴こえ出し、右側30cmくらいのところからはバッキングギターが聴こえてくる。ドラムは真ん中に定位しているけれど、スピーカーのある位置より少し上から聴こえていて、タムを回すと、明らかに位置が変わっていくのが見える感じだ。もちろん、そんな位置には何も存在はしないが、明らかにスピーカーのない方向から聴こえてくるのだから、何か不思議だ。

これまでも、バーチャルサラウンドのような音を出す機材はいろいろと見てきた。その多くは確かにスピーカーより少し音が広がって聴こえるけれど、ちょっとリバーブがかかったようなボケた音になったり、膨らんではいるけどボンヤリした音になるのだけれど、これを聴く限り、リバーブ感は皆無。音の定位だけが、大きく広がっている。

落合氏は「そのスピーカーから80cmほど離れた位置で聴くのがベストですが、多少ずれたところで聴いても大丈夫です」とのこと。試しに少し動いてみたところ、確かに音が聴こえてくる位置や音像は少しボケる気はしたが、広がりがあることには変わりはない。明らかに、このAnkerのスピーカーから出ているようには思えない。

「一般的に立体音響を実現する場合、HRTF=頭部伝達関数を用いて行なうのですが、この技術はHRTFを使っていません。だから個人差は少ないですし、スイートスポットも広がるし、音質変化も少ないんです」と落合氏は説明する。それにしても、あまりに不思議なので、どこかにトリックがあるのでは……と周りをキョロキョロと見まわしたのだが、それらしきものは存在しない。疑る筆者に、岩村氏が「そのスピーカーの左右の片方を手で塞いでみてください」と言われ、試してみると、左右に広がっていた音がいきなりスピーカーの中央に戻ってくる。「何だ、これは? 」という感じだ。

「2つのスピーカーを利用し、片方の音をキャンセリングしていることで、これを実現しているのです。だから片方からの音を止めると効果がなくなってしまうのです」と岩村氏。かなりトリックを使ったミックスをしているのだろうか? 立体的に音が聴こえるように、リードギターは左側に飛び出るように配置し、リズムギターは右側に配置し……と何かスゴイ処理を、一つずつこなすことで、こうした音像を作り上げているのか? そう質問してみたところ岩村氏からは「普通に2ミックスのステレオの音源を、Dnote-LR+で処理して鳴らしているだけですよ」との返事が。にわかには納得できないけれど、音の効果は明らかだ。

市販スピーカー用の音源で体験

こう説明していても、なかなか読者のみなさんには信じてもらえないと思うし、筆者の自宅環境でも、これがホントなのか試してみたいところ。そこで、お二人にお願いして、いま聴いた楽曲の音源をもらったので、ぜひ聴き比べてみてもらいたい。「She's a woman」という曲で、実は岩村氏による楽曲なので、著作権上も問題ないとのこと。まずは、通常の44.1kHz/16bitステレオのWAVファイルを聴いていただきたい。

【音声サンプル】
normal.wav(2.74MB)

以下は、AnkerのスピーカーSoundCore 2用にDnote-LR+の処理を施したもので、スピーカーから80cm離れたところで最適化したデータだ。

【音声サンプル】
Anker Soundcore2.wav(2.74MB)

これはAnkerのSoundCore 2で聴かないと意味をなさないWAVファイル。ということは、SoundCore 2が何か特別すごい機能・性能を持っているのかというと、まったくそうではないとのこと。スピーカーの形や大きさなどの各種情報が分かれば、どんなステレオスピーカーでも実現できるそうだ。そこで、ほかにもいくつかのスピーカー用に同じ楽曲データをDnote-LR+処理をしてもらったので、もし手持ちの機材で、同じものがあれば、ぜひ聴いてみていただきたい。なお、iPad pro 10.5向けも用意しているが、これはビデオ付きも想定した横置き用(Landscape)の音声だ。

【音声サンプル】
Apple iPad pro 10.5.wav(2.74MB)
JDSound OVO.wav(2.74MB)
Panasonic Private Viera UN-19F7.wav(2.74MB)
SONY SRS-HG10.wav(2.74MB)
SONY Xperia Z5.wav(2.74MB)

それぞれのファイル名にスピーカーやデバイスの名前ついているが、その機材用に処理した音源。今回のファイルは、スピーカーから80cm離れた位置で聴くのがベストなものだ。実際に聴いてみれば、きっと筆者の驚きを理解してもらえるだろう。

ただし、これを体験するには条件がある。あくまでもスピーカーで鳴らすことが前提となり、ヘッドフォンで聴いてもまったく効果は分からないということ。そして指定したスピーカーシステムでないと、ほとんど効果がないので、上記機材がなければ、どこかで借りるなどして確かめるほか、術はない。

「ここでは6つの機材用に処理をしましたが、ステレオスピーカーであれば、スマホでも効果がでるし、小型テレビなんかでも効果がでます。サウンドバーなどでもLtoR(左右ユニット)の距離が狭いものなら、音を大きく広げることができます。もちろんノートPCでもステレオスピーカーであれば、効果を出すことができます」と落合氏。そのDnote-LR+の秘訣となるのは左右の音のキャンセリングなんだとか。

「普通はLとRから出た音はそれぞれ交じり合ってしまいます。そこで左から出た音は左の耳だけに、右から出た音は右の耳だけに届くようにキャンセリングすれば、このようなことができるのです。いわゆるクロスキャンセリングなのですが、ただキャンセルしてもうまくいきません。それは、従来のキャンセリングはHRTFを使うから。そこでまったく異なる原理を思いつき、それを使ったところうまくいったんです。これによって人間の脳が、最終的に音の位置情報を錯覚してくれるんです」と岩村氏は解説する。

「人間が立体視できるのは両眼で見ているからです。つまり平行法で見たものと、交差法で見たものの視差情報から立体像を再構築できるのであり、この視差が立体視の強い手掛かりとなります。でも、片眼でも立体的に捉えることができる単眼立体視の存在も古くから知られています。片眼だと視差情報が使えないので、他の情報、たとえば重なりや相対的な大きさ、かすみ、ぼけなどを使って、立体的に認識するというものです。これ音の世界にも応用できないか、というのが、このDnote-LR+を開発したキッカケです」と岩村氏は話す。

立体視の仕組み
両眼と単眼の立体視

“聴覚差”をなくして広い音場を実現する

すごくわかりやすい例のような気もするけど、どうしてこれで、立体的な音が聴こえたのか、やはりピンと来ない。ここで、改めて従来の立体音響の代表例ともいえるバイノーラル録音・再生とトランスオーラル再生について考えてみよう。最近バイノーラルマイクなども安く入手できるようになってきたが、耳元の2つのマイクで録音した音を、そのまま再生すると、その時の音場を再現することができる。これがバイノーラル録音・再生だが、録音時と再生時のHRTFが一致している必要がある。つまり頭の形や耳の形などが同じ、事実上同一人物でないと全く同じように聞こえるのは難しい。

バイノーラル録音/再生

一方、バイノーラル録音したものをスピーカーで再生するのがトランスオーラル再生。これだとヘッドフォン/イヤフォンがなくても再生可能だが、やはりHRTFが前提となるので個人差が大きいし、スイートスポットが狭く、そしてなによりクロストーク、つまり左のスピーカーからの音が右耳に入ったり、右のスピーカーからの音が左耳に入ることを避けなくてはならず、それが極めて困難だ。

トランスオーラル再生

そこで、岩村氏が疑問に感じたのは「音像定位は人間の脳で知覚されるにもかかわらず、なぜ従来の理論は外耳道入り口までの物理的特性(HRTF)だけを扱うのか? 」ということ。その一方で「人の認知1つの情報だけからではなく、複数の情報から使えるものを使って行なわれていることが知られている」ので、「もしかしたらHRTFのキャンセルを行なわなくても、3D音場を知覚させるほかの方法があるのではないか? 」と考えたというのだ。

岩村氏がここで実現したのは、左のスピーカーから出た音は左耳だけに届けて、右のスピーカーから出た音は右耳だけに届けるというもの。本来そんなことはあり得ないけれど、こうすることで左右の視覚差ならぬ“聴覚差”がなくなり、人間は、その音がどこから来ているのか分からなくなるという。が、その結果、人間は聴覚差以外の手掛かりを探し出し、そこから立体的に音を聴くようになり、その結果、先ほどのように広い音像を知覚するという。

“聴覚差”をなくすことで、結果的に広い音場を知覚させるという

ちょっぴり分かったような気もしてくるが、そもそもどうやって左右のスピーカーから出てくる音のクロストークをなくすのか……。実はあまり厳密なキャンセリングをしなくても、人間を騙すことは可能だと岩村氏は言う。「両耳は水平についているので、上下前後に比べて、人間の聴覚は水平位置の感度が高いんです。そこで、主に水平方向の音像定位再現にフォーカスを当てる。つまりITD(両耳間時間差)とILD(両耳間音量差)がメインファクターとすることで、フルのHRTFキャンセリングが不要となり、スピーカーからの距離からだけで簡単にキャンセリングの計算(時間差を考慮の上、逆相を作るなど)が可能になります。だから処理も軽いし、スイートスポットも広くなり、水平成分だけだから個人差も少なくなります」(岩村氏)。

耳は垂直に比べて水平位置の感度が高い

さらにTrigenceが持つDTSCというスピーカーをモデリングする技術を逆フィルターとして用いることで、そのキャンセリングの精度を高めることができるとのこと。

その結果、どこから音が聴こえてくるかという絶対座標には個人差があるものの、300人以上が試聴した結果において、広がり感自体は個人差なく、ほぼすべての人が認知できるという。その構造図を示した。

広がり感を認知させる再生の構造図

逆相にディレイをかけたものを反対のチャンネルから鳴らし、それにフィードバックをかけているという形だ。結構単純な構造でありキャンセリングのためのディレイも全帯域で一定のディレイをかけるものだから、音質変化も少なくてすむとのこと。またバイノーラル録音したソースだけでなく、通常の2chミックスにおいても効果が得られるという。実際、先ほど掲載したWAVなどは、バイノーラルソースではなく、普通の2chミックスのものなので、確かなようだ。

とはいえ、水平成分でのクロストークを抑えるだけで、こんなに音が飛び出しているというのは、まだまだ納得のいかないところ。前述のDTSCという技術が大きなカギを握っているようだ。これについてもいろいろと話を聞いたので、次回は、そのDTSCという技術について紹介していく。

一方、もらった音楽ソースだけでは、何かトリックがあるのでは……と信じられない面もある。そこで、以前この連載で掲載したリニアPCMレコーダで録音した音を渡して、Dnote-LR+処理を施してもらったので、それらの音も紹介していく予定だ。

なお、落合氏によると、このDnote-LR+はリアルタイム処理も可能であり、今後は家電などへの組み込みを想定し、さまざまなメーカーへ働きかけを進めていくという。そのため11月20日~22日に、パシフィコ横浜で開催される「ET & IoT Technology 2019 | ET/IoT総合技術展」のスタートアップパビリオンで展示するとのこと。興味のある方は、これを見に行くとよさそうだ。

藤本健

 リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。  著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。Twitterは@kenfujimoto