藤本健のDigital Audio Laboratory
第885回
ヘッドフォンで立体音響を生み出す新技術「AudiiSion EP」とは?
2021年3月1日 11:29
ここ最近、ヘッドフォンで音を立体的に聴こえるようにする技術が次々と誕生している。従来のような特殊なヘッドフォンを使うのではなく、普通のヘッドフォン・イヤフォンで立体的に音を聴かせるという試みだ。
一般的にヘッドフォンでの立体音響というと、HRTF(Head Related Transfer Function)と呼ばれる“頭部伝達関数”を使って処理を行なうが、今回紹介する「AudiiSion EP」(オーディージョンEP)はあえてHRTFを用いず、独自のデジタル信号処理で立体音響を実現する技術である。
開発元のオーディージョンサウンドラボによれば製品化はこれからとのことだが、特許出願を行なったタイミングでプロトタイプを試させてもらったので、実際の音も紹介しながら一体どのような技術なのか見ていこう。
HRTFを使わずに立体音響を生み出すAudiiSion EP
オーディージョンサウンドラボは昨年10月に設立されたばかりのベンチャー企業で、CEOを落合興一郎氏、CTOを岩村宏氏が務めている。
あれ? この二人、どこかで見たことある……と思った方は、本連載をよくチェックしていただいているのかもしれない。実は一昨年、「オーディオの革命!? 小型スピーカーで広い音場の独自技術、Dnote-LR+を体験」(第823回)という記事で取り上げた開発者の二人なのだ。
第823回:オーディオの革命!? 小型スピーカーで広い音場の独自技術「Dnote-LR+」を体験
Dnote-LR+は度肝を抜かすほど驚かされた技術だったが、その後二人はTrigence Semiconductorをスピンアウトし、新会社であるオーディージョンサウンドラボを設立したのだという。当然、Dnote-LR+を新会社に持ってくることはできないが、その代わりに、また新たに生み出したのが技術がAudiiSion EPだったわけだ。
「Dnote-LR+とコンセプトは近いところがありますが、技術的には別物です。ただ、原理はシンプルなので、2週間程度で基本部分はできてしまったというのが正直なところです。現状はまだヘッドフォンできちんと音を広げる、キレイに広げる事は難しく、試行錯誤を繰り返しています」と岩村氏は話す。
HRTFを使わず、脳の認識を使うというか、錯覚をうまく活用して立体的に音を聴かせるというのはDnote-LR+のときと同様だ。
「HRTFは個人によって大きく異なりますし、左右の耳の形状差もかなりあります。HRTF自体は非常に古くからある技術ですが、いまだに測定が難しく、再現も難しいというのが実情です。正確に再現しようとしても、再現できていない部分が悪さをし、余計にうまく認識されない、といったこともあります。それなら、阻害要因をできうる限り排除したほうが、人間は認識しやすいのではないかという発想で、極力余計なことはせず、シンプルに作ったのが、AudiiSion EPなのです」(落合氏)。
理屈を紹介されても、なかなかピンとこないと思うので、まずは以下の2つの音をヘッドフォンかイヤフォンで聴いてみて欲しい。
【音声サンプル】
Thunderstorm_EP0227B Hi.wav(6.31MB)
She’s A Woman_EP0227B Hi.wav(5.76MB)
※編集部注:編集部ではファイル再生の保証はいたしかねます。
再生環境についての個別のご質問にはお答えいたしかねますのでご了承下さい
どうだろうか。「え? これがヘッドホンでの音?」という感じで、かなり立体的に聴こえたのではないだろうか。この音データは、普通のステレオサウンドを、AudiiSion EPを通して出力したものだ。まさにAudiiSion EPをリアルタイム・エフェクトとして使っているのだが、そのパラメーターを変更することで聴こえ方も少しずつ変わっていく。
以前、同じ音源をDnote-LR+を使って聴いたとき程の衝撃ではなかったが、共通して感じるのは、音が濁ったりボヤけたりせずに、立体化されているという点だった。
「あまり変な加工はしていません。行なっているのはフィルターをかけて、反射を足したりしているだけです。HRTFの研究者から見ると、『その方法は正しくない』などと指摘されそうなことばかりですが、結果として自然な音の広がりになっていると思います」と岩村氏。
ご存知の通り、ヘッドフォンやイヤフォンで音を聴くと普段とは違う形で耳に音が届くため、頭内定位と呼ばれる状態になりやすい。そこで、前述のHRTFを使って頭外定位を実現し、立体・空間音響を実現しようとするのだが、さまざまな困難がある。
正確にHRTFが再現されていれば360度音場を実現できるが、それが正確に行なえないために、音質変化・劣化を感じると同時に、脳内の音像認識も阻害し、原音よりも悪く聴こえてしまったりするのだ。
AudiiSion EPでは、人間が聞いた音を脳内でどのように認識しているかに注目し、その認識を阻害している要因を低減したAPTF(Auditory Perceptual Transfer Function)、つまり“脳内認識伝達関数”なる新たな技術を用いたデジタル信号処理を行なっているのだ。これにより臨場感や没入感に優れた実世界で「音を聴く」ような試聴環境を創り出すことができるという。
特徴として、落合氏は以下の7つをピックアップする。
- 「前方定位」ではなく「頭外定位」を実現し、空間を大きくする
- 製品や個人ごとに最適化する必要がない
- マルチチャンネルソース不要(通常の2chソースのみ使用)
- 音質変化が小さい、音像定位がクリア
- 固定小数点演算、フィルターの係数精度は8ビット以下
- 演算量が少なく、固定小数点演算で6~14MIPS程度
- 圧縮音源を再生しても効果が弱まりにくい
プロトタイプのソフトを使い、効果を検証してみる
果たしてどんな音でも、同じように広がるのか。Windows用に作られたプロトタイプのソフトを使い、自分でも試してみた。同ソフトはスタンドアロンで、入力と出力を指定すれば、すぐに使えるシンプルなものとなっている。
開発にはMATLABを使っているとのことで、Windowsに限らず、macOS、Linux、iOS、Androidでも使うことが可能。仕組み的にはシンプルなので、組み込みソフトなどに展開する事もできるという。また処理が軽いだけに、ニアゼロレイテンシーで聴けるのもポイント。
このソフトは、入ってきたオーディオ信号をリアルタイムに加工して出力する。オーディオインターフェイスを用意して、外からのオーディオ信号を入力するのも手だが、せっかくであれば1台のPCで完結したいと考えた。
そこで、以前にも記事で紹介した仏VB-Audio Softwareが開発・販売するドネーションウェア「VoiceMeeter Banana」を使うことにした。このVoiceMeeter Bananaが仮想オーディオドライバとして機能することで、オーディオプレーヤーソフトの出力をAudiiSion EPに送ることができるようになり、またAudiiSion EP側で受け取ることができる。
岩村氏によれば、Bananaの下位ソフト「VB-Cable」でも十分で、「面倒な設定が少なく簡単に扱える」とのことだったが、foobar2000やVLC Media Playerのようにオーディオドライバを指定して再生するプレーヤーソフトはもちろん、Windowsのシステム側で出力先をVoiceMeeter Bananaにすることで、GrooveミュージックやWindos Media Playerのようなプレーヤーソフト、さらにはブラウザを使って再生するYouTubeなどでも利用することができた。
画面はいたってシンプルで、いくつかのプリセットを変更するだけで、音の広がり方も変わってくる。基本的には最も効果の大きい“ATPF5”を選んでおくのがよさそう。
主なパラメータは下記表のとおり。Widthで広がりが変わり、Angleで音像の角度を設定できるのが面白い。ごれをグルグル動かすとちょっと目が回りそうになる。
ただ、いろいろ試してみて感じたのは、どの音楽ファイルでも音は広がるが、左右の分離がハッキリしている音源ほど、より広がって立体的に感じられるという事だった。基本的には、センター定位の楽曲だと、それほどは広がらない。というわけで、左右分離の良い音楽データを使って作った例がこちら。その下にある元データと比べてみてほしい。
【音声サンプル】
PureRockVo_EP0227B Hi.wav(4.04MB)
PureRockVo_Org.wav(4.04MB)
※編集部注:編集部ではファイル再生の保証はいたしかねます。
再生環境についての個別のご質問にはお答えいたしかねますのでご了承下さい
取材を通じ、AudiiSion EPは面白い効果が得られるシステムだと感じた。
問題は、今後これをどのように展開するのかという点だろう。落合氏は「単体の製品に組み込んでも、ビジネス的には広がらない。理想としては、スマホに搭載できればいいですね。またソフトウェアで簡単に実現できるので、ゲームアプリなどに入れる方法も考えられます。アイディア次第でさまざまな使い方ができると思うので、興味のある方はぜひお問い合わせください」とのこと。今後、どのような用途で使われるようになるのか楽しみだ。