藤本健のDigital Audio Laboratory
![](/img/avw/corners/series/dal/dal_t.png)
100万円のスピーカーの音を安価に実現!? Dnote-LR+が見せる音の新たな未来
2019年10月7日 12:31
「これはオーディオ革命に違いない」と思えるほどビックリした技術の「Dnote-LR+」。日本のベンチャー企業、Trigence Semiconductorが開発したもので、スピーカーから音を飛び出させる不思議な信号処理を行なうテクノロジーだ。前回に続き、今回はDnote-LR+に搭載されているスピーカーをシミュレーションする技術「DTSC」を中心に見ていこう。
これまでもバーチャルサラウンドとか2つのスピーカーで実現する立体音響というものはいろいろあったけれど、これらとは明らかに何かが違う。前回の記事で、サンプルサウンドを公開したところ大きな反響があった。これは、多くの方が、音の飛び出す魔法のような不思議な体験をしたからだろう。
手持ちの音源でも立体化できるか試した
前回に掲載したデモサウンドをお聴きになった方は体感したと思うが、Dnote-LR+というシステムでエンコードした音は、スピーカーから“飛び出して”聴こえる。スピーカーのある場所から音が聴こえるのではなく、だいぶ離れたところから音が出てくるので、とても不思議に感じる。
以前から、「HRTF(頭部伝達関数)」を用いて、音を立体的に聴かせるという技術はあったが、HRTFだと個人差が大きいのに対し、Dnote-LR+は個人差なく、誰でも体感できるのが大きな特徴。またHRTFの場合、ヘッドフォンを使うのが前提となるのに対し、Dnote-LR+はスピーカーを使うのが前提であり、これをヘッドフォンで聴いてもまったく効果がない。
また、個人差はないけれど、再生するスピーカーは特定するため、ほかのスピーカーを使ってもまったく効果がなくなるのも、ほかと違うユニークなところだ。音が飛び出す仕組みについては前回の記事に譲るが、改めて前回掲載したデモサウンドをここに載せておくので、まずは、これを聴いてみてほしい。
【音声サンプル】
normal.wav(2.74MB)
上記サウンドを、各種スピーカー用にエンコードしたものが以下のサウンドだ。
【音声サンプル】
Anker Soundcore2.wav(2.74MB)
Apple iPad pro 10.5.wav(2.74MB)
JDSound OVO.wav(2.74MB)
Panasonic Private Viera UN-19F7.wav(2.74MB)
SONY SRS-HG10.wav(2.74MB)
SONY Xperia Z5.wav(2.74MB)
あまりにも不思議に思えた一方、これだけ立体的に聴こえるのは、特殊な音源だからなのではないのか? と質問を投げたところ、Trigenceの製品マーケティング部統括部長 落合興一郎氏は「ある程度、ステレオ感がしっかりした音でないと、実感しにくいことは確かです。またモノラル音源だとほとんど効果は得られません」との返答。いくつかの映画作品やアニメーション作品などのDVD映像を見せてもらった。これらは著作権の問題でここに掲載することはできないが、上記サウンドと同様の立体感を得ることができた。
ほかにも、フリー素材としてボーカル曲もエンコードしてもらったので、こちらもお聴きいただきたい。サンプルとして作ってもらったのは、上記と同じスピーカーだ。
【音声サンプル】
FreeVocal Normal.wav(3.31MB)
FreeVocal Anker Soundcore2.wav(3.31MB)
FreeVocal Apple iPad pro 10.5.wav(3.31MB)
FreeVocal JDSound OVO.wav(3.31MB)
FreeVocal Panasonic Private Viera UN-19F7.wav(3.31MB)
FreeVocal SONY SRS-HG10.wav(3.31MB)
これを聴いてみると、やはり冒頭のデモサウンドと同様、左右に大きく広がっているけれど、ボーカルは明らかに真ん中に定位している。不思議な感じだ。
さらに疑り深い筆者は、こちらから指定したファイルが実際、エンコード可能なのか試してみるために、リニアPCMレコーダーで収録した音を渡し、同じように各スピーカー用のファイルを生成してもらった。使ったのは第797回の記事においてソニーのPCM-D10でレコーディングした野鳥の鳴き声と、電車の音。それぞれ96kHz/24bitの音だが、24bitもの分解能は不要ということだった、96kHz/16bitのデータとなって送られてきた音声を掲載する。
【音声サンプル】
pcmd10_bird_Normal.wav(11.56MB)
pcmd10_bird_Anker Soundcore2.wav(11.56MB)
pcmd10_bird_Apple iPad pro 10.5.wav(11.56MB)
pcmd10_bird_JDSound OVO.wav(11.56MB)
pcmd10_bird_Panasonic Private Viera UN-19F7.wav(11.56MB)
pcmd10_bird_SONY SRS-HG10.wav(11.56MB)
【音声サンプル】
pcmd10_train_Normal.wav(11.31MB)
pcmd10_train_Anker Soundcore2.wav(11.31MB)
pcmd10_train_Apple iPad pro 10.5.wav(11.31MB)
pcmd10_train_JDSound OVO.wav(11.31MB)
pcmd10_train_Panasonic Private Viera UN-19F7.wav(11.31MB)
pcmd10_train_SONY SRS-HG10.wav(11.31MB)
@@size|70|※編集部注:96kHz/24bitで録音したファイルを変換して掲載しています。
編集部ではファイル再生の保証はいたしかねます@@
これを聴いてみると、先ほどの音楽データほどのインパクトはないが、これは録音に使ったレコーダーの性能という面もあるかもしれない。とはいえ、やはり元のデータと比較すると、ずいぶん立体的になるのが感じられる。
「DTSC」技術で安価なスピーカーでも高級モデルの音が出せる?
ここからが今回の本題。前回の記事でも少し触れたとおり、Dnote-LR+の技術は、クロストークキャンセリングとともに、DTSC(Digital Thiele Small Correction)というスピーカーをモデリングする技術によって成り立っている。このDTSCもTrigenceが開発した独自技術であるが、考え方自体はシンプルだという。
「スピーカーの特性を表すT/Sパラメーターというものが昔からあります。これはスピーカーの大きさやコーン紙の硬さ、磁石の強さやキャビネットの形/大きさなどによって変わってくる特性を等価回路で表すためのものです。DTSCはこのT/Sパラメーターを活用したモデリングなのです」とTrigenceの最高技術責任者、岩村宏氏は話す。T/Sパラメーターはドライバのスペック表などに書かれているもので、インピーダンスメーターがあれば簡単に測ることができるのだという。
「T/Sパラメーターはこれまでドライバをどのくらいの箱に収めればいいのか、といったことに使われる以外、あまり利用されるケースはなかったと思います。せっかく共通のパラメーターとして存在していたのに、あまり数値解析には使われていませんでした。そのT/Sパラメーターに着目して、モデリングに活用してみたのです。実際に試してみると、ある程度アバウトな数値でも十分制御可能で、似たサイズのパラメーターであれば、近いものを再現することができます」(岩村氏)
「このDnote-LR+はリアルタイムでエンコードできるんですよ。実際少し音を出しながら試してみましょう。たとえばコーンの紙を少しずつ硬くしていくと、こんな風に音が変化していきます。また磁石の磁力を強くしていくとこのように変わるのです」と落合氏はデモしてくれた。
ここではPCのソフトウェアで調整していたが、そのパラメーター画面も見せてもらった。Blが磁力の強さ、Kmsはドライバの動きにくさで、これが小さいと低域が出る。またMmsは振動板の重量を表すもので、Cbはキャビネット=箱の大きさを示すものとのこと。
このパラメーターの設定は、数字で指定してもいいが、ここではMIDIコントローラーが対応させてあったので、これを動かすことでリアルタイムに音を変化させることができる。まさにT/Sパラメーターを動かしていくことで音が変化していくのだが、音的にはイコライザ的な変化ではあった。いわゆるグラフィックEQやパラメトリックEQなどとはまったく違う手法なわけだ。
「やっていること自体は、理論にしたがって数値計算をしているだけです。数式で見ると、こんな感じで、難しそうなものになってしまいますが。ただ、パラメーターを元に単純に計算するだけなので、負荷は軽くリアルタイム処理できます」と岩村氏。
今回はPCの演算でリアルタイム処理していたが、DSPを使った小さな機材でも同様の処理ができるとのことで、そのプロトタイプ機材も見せてもらった。
数式が出てきてちょっと難しくなってしまったが、要するに鳴らすスピーカーと、目的とするスピーカーの特性、つまりT/Sパラメーターが分かれば、違うスピーカーの音をモデリングできるという。極論を言えば“手元にある1,000円のスピーカーで、100万円のスピーカーの音が出せる”というわけだ。
もっとも、これは単なる理論上の話であって、実際にはそうはいかないのは当然の話。例えばiPhone搭載のスピーカーでGENELECのラージスピーカーをモデリングして出したとしても、そもそも物理的限界からしっかりした低域が出せるはずもないし、大音量も出せるはずがない。けれども、限界の範囲内で“それっぽくする”ことが可能という技術なのだ。
「DTSCはサンプルごとに振動板の位置や速度を推定しています。また、ターゲットとなるモデルを変更することにより、振動板の動く範囲なども制御することが可能です。さらに振動板の位置によりリアルタイムにスピーカーモデルを変えて、振動板の動きに制限をかけることも可能になっています」と岩村氏。
こうしたシミュレーションにより、さまざまなスピーカーをモデリングする一方で、前回解説したクロスキャンセリングによって、スピーカーの位置を変える技術を備えたDnote-LR+。これをどう使うかはアイディア次第。PCのスピーカーに組み込んで、しっかりしたスピーカーで鳴らしたような音を実現するとか、テレビに内蔵されたスピーカーをより立体的な音がするものにしたり、ポータブルゲーム機でより臨場感を増すようにするなど……。今後さまざまなアイディアを形にできるのではないだろうか。
この技術は、11月20日~22日に、パシフィコ横浜で開催される「ET & IoT Technology 2019 | ET/IoT総合技術展」のスタートアップパビリオンで展示するとのことだが、家電メーカーやオーディオ機器メーカー、ゲーム機メーカーなどとの交渉をしていくことを目指しているという。早く、これが何らかの製品として世の中に登場してきてくれるのを期待したい。