小寺信良の週刊 Electric Zooma!

第885回

Zooma!:ズームレンズ、ズームすること、ズームする人、ズズーンの造語

耳を撮影し“自分に最適なサラウンド”に、クリエイティブ「Super X-Fi」

カスタム・サラウンド時代の到来

CES 2019では数多くの新技術がお披露目されたが、“新体験”という意味では、ソニーの「360 Reality Audio」のヘッドフォンによるデモンストレーションは素晴らしかった。音源をオブジェクトとして扱い、配置を決めて立体音響をレンダリングするという方法論に注目されがちだが、きちんとした特性を出すためにまず聴き手の耳の中に小型マイクを入れ、測定音で特性を測定した後、各個人にカスタマイズされたレンダリング結果を聴かせるという、非常に精度の高いデモだった。

クリエイティブメディアの「SXFI AMP」(下)と「SXFI AIR C」(上)

そもそも耳の左右に2つのスピーカーがあるだけのイヤフォンで、前後上下方向に音を定位させるためには、バーチャルサラウンドの技術が必要になる。以前からフロントサラウンドやバーチャルサラウンドの技術は多く存在するが、これのよりどころになるのが「頭部伝達関数」(Head-Related Transfer Function/HRTF)である。これは耳たぶや頭の大きさ、形、肩幅といった人間の形状をアルゴリズム化して、左右以外の位置に音を定位させるための演算に使用するパラメータである。

ほとんどの人は平均的なHRTFの値を用いればサラウンドに聴こえるのだが、何かが平均値から離れている人は、サラウンドに聴こえない。以前ドルビーの技術者にこの点を確認したところ、平均的なHRTFでは、一定数(10数%)の割合でサラウンドに聴こえない人が出るという。実を言えば、筆者はその一定数の“聴こえない人”の一員である。

もちろんこれは、ある特定の人だけがパタッと聴こえないというスイッチ的なものではなく、人によってその聴こえ方に差があるという事でもある。この個人差を極限まで無くすためには、ソニーのデモのようにいったん個人の特性を測定してパラメータ化する必要があるわけだ。

その測定がユーザー自身でできるならともかく、誰かにやって貰うとか特別な道具や部屋が必要となれば、非常に手間やコストがかかる。だがこれを、耳と頭の写真を撮るだけでやってしまおうという製品がある。クリエイティブメディアのヘッドフォン向け3Dオーディオ技術「Super X-Fi(スーパーエックスファイ)ヘッドホンホログラフィ」がそれだ。

技術発表自体は2018年1月のCESで発表されたものだが、その対応製品3つがいよいよ日本でも、直販サイト限定で1月下旬から順次発売される。直販価格と発売時期は、小型USBヘッドフォンアンプ「SXFI AMP」が16,800円で1月下旬。ワイヤレスヘッドフォン「SXFI AIR」が17,800円で2月中旬(ブラックカラー)。有線ヘッドセット「SXFI AIR C」が13,800円で1月下旬だ。

今回はこの中から、「SXFI AMP」と「SXFI AIR C」をお借りした。パーソナライズするサラウンド世界を体験してみよう。

Super X-Fi搭載の3製品。左下がUSBヘッドフォンアンプ「SXFI AMP」、右上がワイヤレスヘッドフォン「SXFI AIR」、右下が有線ヘッドセット「SXFI AIR C」
両製品パッケージ

ホログラフィック・オーディオとは

クリエイティブが推奨するホログラフィック・オーディオとは、マルチスピーカーでのリスニング体験をヘッドフォンで忠実に再現することを目的としている。例えば映画コンテンツの5.1chや7.1chのソースを使って、ヘッドフォンで自然なサラウンド音場を作り出すという。

また音楽のような2chオーディオに関しては、前方に設置されたステレオスピーカーで聴いているような音像を作り出すことを目的としている。そもそも音楽はステレオスピーカーでの再生を前提として音作りがされているため、耳のすぐ脇にスピーカーがあるヘッドフォンでは同じ音像にならず、左右の耳を直線で繋いだ線上に音が定位する。これを“頭内定位”といい、イヤフォンやヘッドフォンでの限界と言われてきた。これを解消するというのが、大きな目的となる。

つまり本製品は、特別にレンダリングされたソースは不要で、普通のストリーミングコンテンツでもある程度の効果が得られる。さらに5.1や7.1といったサラウンドソースならなおよし、という事である。

まずはヘッドセットタイプの「SXFI AIR C」から見ていこう。これはヘッドフォンとマイクからなるヘッドセットで、方向性としてはゲーミングも意識した製品と言える。

ヘッドセット型の「SXFI AIR C」
マイクは取り外し可能

一般的なマイク付きヘッドセットのように見えるが、左側にMicro USB端子があり、付属ケーブルでPCなどのUSB-A端子に接続する。対象機種としては、Windows、Mac OS、PS4、Nintendo Swichが挙げられている。ただ、測定にアプリを使い、カメラで顔を撮影する必要があるため、最初だけAndroidのスマートフォンが必要だ。

入力端子はMicro USBとアナログのステレオミニジャック

コントローラーはすべて左側に集中しており、SXFI機能のON/OFFスイッチのほか、ボリュームダイヤル、マイクミュートボタンがある。ライトのON/OFFボタンは、ヘッドフォンのハウジング部のライトのON/OFFだ。そのほかアナログ入力もあるので、SXFI機能を使わず普通のアナログヘッドセットとしても利用可能だ。

ON/OFFスイッチで効果が比較しやすい
ヘッドフォンとしてもなかなか上質

一方「SXFI AMP」は、スティック状のデバイスで、上部にミニタイプのヘッドフォン端子、底部にUSB Type-C端子がある。こちらはPCやゲーム機など前出4製品に加え、Androidスマートフォンでの利用も想定した製品だ。あいにくiPhone/iPadには対応しない。

スティック状のヘッドフォンアンプ「SXFI AMP」

表面にはSXFI機能のON/OFFスイッチ、ボリュームのアップダウンボタン、コンテンツの再生・停止ボタンがある。上記どちらの製品も電源はUSB端子から取るため、電源ボタンやバッテリー等はなく、一般的なUSBデバイスと同じ扱いとなる。

上部にステレオミニジャック
底部にUSB Type-C端子
Androidスマートフォンと簡単に接続できる

なお今回はお借りしていないが、Bluetooth接続の「SXFI AIR」は、iPhone/iPadにも対応しているようだ。

パーソナライズは簡単

まずはパーソナライズから。SXFI設定アプリは現在のところAndroid用とWindows向けが提供されているが、顔と耳の写真を撮影して「ヘッドマップ」と呼ばれるパーソナライズが可能なのは、現時点ではAndroid用の「SXFIアプリ」だけだ。そのため、どの製品ユーザーも、まずはAndroid用のアプリを使う必要がある。

SXFIアプリでは、まずアカウントを作ってログインした後、左右の耳と顔の写真を撮影する。するとその情報がクラウドへアップされて、各個人の「ヘッドマップ」が完成する。あとはAndroidなりPCなりでアプリを立ち上げ、SXFI対応製品と接続すると、クラウドにあるヘッドマップ情報が製品にロードされて、各個人専用にカスタマイズされた製品になる、という流れだ。

パーソナライズとは言っても、実際にやることは写真撮影だけだ。しかし耳の写真をきちんと撮影するのは、1人では難しい。そこだけは誰かに撮影して貰うしかないだろう。

顔を撮影。顔の輪郭と目、鼻、口の位置が抽出されたのがわかる
耳を撮影。耳の大まかな形が抽出される

SXFI AMPの場合は、自分の好きなヘッドフォンやイヤフォンを接続できる。ただ各ヘッドフォンは特性がそれぞれ違うため、一部の製品にはあらかじめ専用のプリセットが用意されている。あいにく筆者手持ちのヘッドフォンは少ないが、日本でも人気の高いShureやゼンハイザーの製品がラインナップされているのがわかる。KOSS PORTAPROもある。

アプリから接続ヘッドフォンを選択

一方Windows用アプリでは、イコライザー設定やライトのカラーをマニュアルで設定できるなど、細かいカスタム機能が使える。

イコライザー機能はWindowsアプリにしかない

どんなソースでも効果がある

まずは2chの音楽ソースからテストしてみよう。使うのは「SXFI AIR C」。こちらの方が、ヘッドフォンが一体となった製品なので、SXFIの効果がより最適な形で聴こえるはずである。

Android標準アプリである「SXFIアプリ」には、1曲だけ楽曲が収録されている。これを聴いてみたところ、確かに頭内定位がなくなり、頭の外側に音像が拡がるのを体感できた。ただ、センターに定位するはずのボーカルも滲んだように聴こえてしまい、立体感は出るがリアリティは減る、といった印象だ。

基本的にはヘッドマップが製品にロードされていれば、専用アプリでなくてもSXFIの効果は再生はできるはず。そこでGoogle Play Musicから適当に楽曲を選んで再生したところ、ちゃんとSXFIの効果は得られた。ゲーム機を接続する時も、専用アプリは入っていないが、あらかじめロードしておいたヘッドマップを使うカタチになる。

好きなイヤフォンで聴きたい場合は、SXFI AMPの出番である。こちらを接続し、「SXFIアプリ」からイヤフォンの種類を選択する。あいにく手元にはShureのSE535とSRH940しかないが、これらはプリセットには無かった。

プリセットにないヘッドフォンやイヤフォンのために、「Unknown Headphone」と「Unknown In-Ear」というプリセットも用意されているので、これを使った。なお、試しに他のヘッドホンのプリセットも試してみたが、各製品の周波数特性に合わせて音質に調整が加えられているようだ。ただし、リストにないイヤフォンやヘッドフォンでは効果が得られないということでもないようだ。

個人的に大きな効果があったのは、“ながら聴き”に最適だった点である。筆者は仕事に集中するためにイヤフォンで音楽を聴くことが多いが、あまり音楽が立ちすぎるとかえって注意が削がれることがある。

これまでは音量を抑えたり、注意を引かないふんわりした音楽を選ぶなど色々工夫が必要だったが、SXFIでは音が直接脳に入ってくる感じがなくなるので、音楽のタイプに関わらず仕事に集中できた。これまで、イヤフォンやヘッドフォンの音がいかに不自然に注意を引くものだったのか、よくわかる。

続いて映像の5.1ch音声がどのように再生されるか、テストしてみた。ストリーミングサービスの映像コンテンツも、比較的新しめのコンテンツなら5.1chで配信されていることが多い。そこでNetflixで配信されているコンテンツで試してみることにした。

今年からシーズン2の配信が始まったスター・トレック:ディスカバリーも5.1ch配信

Windows 10の場合は、サウンドデバイスの「構成」でSXFI AIR Cを5.1chスピーカーシステムとして割り付けておく。

ただPCで視聴する場合は、そもそも5.1chで再生できるかどうかはアプリによる。NetflixのFAQによれば、Microsoft SliverrightおよびHTML5を使用したブラウザベースでの再生では、5.1chサラウンド音声は再生できない。一方Windows 8および10向けのNetflix専用アプリでは機能する。

そこで今回は、Netflix専用アプリで視聴してみた。2chソースをサラウンドに変換するのと比べ、ソースがマルチチャンネルの場合、よりクオリティが高い。本来拡がって聴こえる部分はキチンと広がり、セリフのように芯のある音声は滲まずにセンターで聴こえる。

ただし、本物のスピーカーを配置した時のように、前後に定位が分かれて、遠くから聴こえる感じは筆者にはなかった。距離が少し近く、頭の周囲広くから音が聴こえる感じだ。だが頭内定位の解消には十分だし、本来サラウンドが目的とするのはこういうことなのかもしれない。

iTunesでレンタル/購入できる映画にも、5.1ch音声が入っている。Macで楽しむ場合は、こちらも事前にユーティリティの「Audio Midi設定」からSXFI AIR Cのスピーカー構成を5.1chに設定する。

Macでは「Audio Midi設定」に同様の設定がある

この方法なら、Macでもサラウンド再生は可能なようだ。実際にiTunesストアから「アントマン&ワスプ」をレンタルし、再生してみたところ、コンテンツ鑑賞に十分な効果が得られた。ただ、ある程度この効果への「馴染み」は必要になる。1時間ほど聴いていると、セリフは画面方向から聴こえ、音楽や効果音はきちんと空間的な容積がある部屋で鳴っているような聴こえ方をする。

最安13,800円(SXFI AIR C)の投資でこれだけの効果が得られるのであれば、映画ファンは十分に検討する余地がある。特にヘッドフォンの特性に最適化されているSXFI AIR CやSXFI AIRでは、効果がよりわかりやすい。

一方いろんなヘッドフォン/イヤフォンが接続可能なSXFI AMPの場合、SXFI効果としてどうなれば正解なのかがわかりにくい面もある。アップデートで特性プリセット製品の充実を期待したい。また、SXFI AMPはSXFI機能を聴く以外にも、スマホ用のDAC内蔵ヘッドフォンアンプとして利用できるメリットがある。DACも旭化成エレクトロニクスの「AK4377」が搭載されている。

総論

実に面白い製品が出てきた、と思う。オーディオでは近年「ハイレゾ」というジャンルが誕生したが、一時期の熱狂的なブームも沈静化し、今はわりとマニアックなポジションに高止まりしている感じがある。そうなった理由は、ハイレゾの良さが聴いてわかる人と、わからない人がいるからである。すなわち、“万人に関係ある”というものでもない技術だった。

一方ヘッドフォンやイヤフォンのサラウンド化、加えて2chソースの頭内定位解消は、万人が聴いてわかる。スイッチ一つで比べられるほか、既存の音楽ソースでも効果があるからだ。

映像コンテンツでは、ドルビーAtmosだ、22.2chだとサラウンド技術がどんどん拡張されているが、そんな数のスピーカーが用意できるのはごく一部の限られた人達だけである。だがそれがヘッドフォンやイヤフォンでサラウンド音場が体現できるのであれば、メリットは計り知れない。ソースはすでにあるからだ。

耳の写真を撮るだけで、という測定技術は、今後データが蓄積されることで加速度的に精度が上がっていくはずだ。今後サラウンド系の市場は、パーソナライズへ向かうことで大きな成長が見込めるだろう。

小寺 信良

テレビ番組、CM、プロモーションビデオのテクニカルディレクターとして10数年のキャリアを持ち、「難しい話を簡単に、簡単な話を難しく」をモットーに、ビデオ・オーディオとコンテンツのフィールドで幅広く執筆を行なう。メールマガジン「金曜ランチビュッフェ」(http://yakan-hiko.com/kodera.html)も好評配信中。