トピック

自分に最適な音色のイヤフォン作ったら驚愕した。final「自分ダミーヘッドサービス」

「自分ダミーヘッドサービス」を適用したfinal「ZE8000」

完全ワイヤレスイヤフォンを中心に、話題になっているのが“個人最適化機能”だ。しかし、使う人の好みに合わせた音にしたり、空間オーディオの立体感を高めたり、ノイズキャンセルの最適化など、各社のいろいろな機能が“個人最適化”という言葉でアピールされており、人によって連想する機能が違う、ちょっと“フワッとした”言葉になっている。

一方で、そんな個人最適化を、ガチで徹底し、イヤフォンの“音色向上”に全振りしたサービスを、finalがスタートした。その名も「自分ダミーヘッドサービス」。同社の完全ワイヤレス「ZE8000」をユーザーに最適化する有料のサービスだ。

ぶっちゃけ、取材に行く前は「ああ、よくある最適化機能の一種でしょ?」と軽く考えていた。しかし、神奈川県・川崎にあるfinal本社の暖簾をくぐり(本当に入り口に暖簾があるのだ)、回転する椅子に案内され、水泳帽みたいな不思議な帽子をかぶらされ、「動かないでください」と言われながら上半身の精密スキャンをされている段階で「あれ、これなんか他社の最適化とレベルが違くね?」と思い、「来週もまた作業があるので来てください」と笑顔で言われた段階で「あ、これガチなヤツだ」と気がついた。

神奈川県・川崎にあるfinal本社

ちなみにこのサービス、55,000円もかかる。なんとZE8000本体(29,800円)よりも高価だ。記事を“そっ閉じ”しようとしたアナタ、ちょっと待って欲しい。結論から先に言うと、最適化してもらったZE8000を受け取り、音を聴いた瞬間に「え、今までのイヤフォンって何だったの!?」と、私は冗談抜きで頭を抱えた。それほど衝撃的な効果がある。

自分ダミーヘッドが出来るまで

基本情報として、このサービスが利用できる対象者は

  • ZE8000を既に使っているユーザー
  • 川崎駅から近いfinal本社に2回行ける人

となる。理由は追々説明しよう。

私は以前からZE8000を気に入って使っていたので、その愛機を持って川崎のfinal本社にお邪魔した。そこで測定の流れや、その狙いを丁寧に説明していただいたのだが、詳細は後述する。まずはどんな測定をしたのかをレポートする。ちなみに測定内容は、一般ユーザーが受けるサービスとまったく同じだ。

final本社にお邪魔、まずは詳しい測定の流れや狙いを説明してもらえる

1日目は“測定”だ。まず、持参したZE8000を預けて、説明を聞いた後、“回る椅子”へと案内される。ジャケットを脱いで、メガネを外して椅子に座る。そして、頭の天辺に小さなキューブがついている不思議な帽子をかぶる。

水泳のキャップのようなものをかぶる

その状態で動かないように指示されるので、じっとしていると、椅子がゆっくりと回転。LiDAR内蔵のスマートフォンを使い、自分の上半身を3Dスキャンしてもらう。帽子をかぶるのは測定時に邪魔になる髪の毛を抑えるため。頭頂部にあるキューブは、測定時のガイドになる。ちなみに、明るめの服を着ている方が、3Dスキャンはしやすいそうだ。

じっとしているのは意外に難しいもので、視線が動くと、つられて首や頭が動いてしまう事がある。そうならないよう、測定ゾーンの壁にはラインが引かれており、回転中はそのラインを見ていると、頭の位置が動きにくいように工夫されている。

上半身のスキャンが終わると、次はより高精度な装置を使い、耳穴や耳のまわり(耳介と外耳道入り口付近)をスキャンしてもらう。

より高精度なスキャナで、耳まわりの形状を詳細にスキャン
自分の耳の3Dデータが画面上に徐々に現れる

この2種類の測定により、自分の上半身の形状データと、耳と耳の周囲のより高精度な形状データが3Dで得られる。

測定はもう1つある。

フロアを移動して、電話ボックスのような防音室に通される。そこにある椅子に座り、両耳に小さなマイクを取り付けてもらう。そして、マイクを装着した耳に向けて、スピーカーで測定用の信号を再生。これにより、耳の中に音が入ると、それがどのように変化するかという、耳穴の物理特性が得られるそうだ。

ここまでが1日目の作業で、所要時間は約2時間。要するに“自分の上半身と耳の形状を精密に測定”してもらったわけだ。

その3Dスキャンデータを基に、finalは物理シミュレーションを行ない、音響物理量を綿密に計算。その上で、私の精巧なアバターこと、“自分ダミーヘッド”をデータ的に形成してくれる。

面白いのはここからだ。

finalが独自に開発したソフトを使い、バーチャル空間に、私のダミーヘッドを配置。その空間の中で、音を仮想的に再生し、ダミーヘッドに音がぶつかった時にどのように変化するかを計算していく。これにより、ちょっと難しい言葉だが「音の空間印象」と「音色認識」を検証する。

このバーチャル空間 + ダミーヘッドから得られた音響物理パラメーターを、私が持ち込んだZE8000に内部に書き込んでくれる。この演算や書き込みの作業に時間がかかるほか、最終的な音の確認も必要なので、1回で終わらず、2回のfinal訪問が必要になるわけだ。

約1週間後、再びfinalの暖簾をくぐる

約1週間後、再びfinalにお邪魔すると、私の音響物理パラメーターを書き込んだZE8000が置かれている……が、まだ持って帰れない。試聴によるアライメントが必要だからだ。

私の音響物理パラメーターを書き込んだZE8000

この試聴が、非常に面白い。

机にパソコンとペアリングしたZE8000が置かれており、パソコンの画面に様々なジャンルの楽曲が表示されている。マウスでクリックするとその曲がZE8000から再生されるのだが、画面に「A」「B」「C」というボタンが用意されており、それを押すと微妙に音の聴こえ方が変わる。

男性アナウンサーの声、コーラスの声、楽器のソロなどを聴きながら、「うーんこれはAがいいな」、「これならCかな」という感じで10回ほど“しっくり来る音”を選択していく。比較試聴がしやすいように、マウスをクリックすると、楽曲の一部だけを繰り返し試聴しやすいように作られている。

悩ましいのは「A」「B」「C」の違いがわずかである事。曲や声によっては、ほとんど違いが感じられない事もある。そういった場合は「パス」も可能。無理にどれかを選ぶ必要はなく、違いが無ければパスでOKだという。

このアライメント作業、私はてっきり「音の好み」を調べているのかと思っていたが、実はそうではない。これは、前述の自分ダミーヘッドのデータに、「ユーザーが聴覚的にどのように感じているか」というパラメーターを付与するための作業なのだという。

つまり、1回目の上半身や外耳道入口付近の3Dスキャンや外耳道の物理特性の測定から、ほぼほぼ、そのユーザーの音響物理パラメーターは導き出せているが、その精度をより高めるための作業と言える。逆に言えば“A、B、Cほとんど違いがない”と感じたら、1回目の測定が、とても良い精度で出来ていた証拠とも言えるわけだ。

finalではこの作業を「メガネの作成」に例えている。1回目の測定は裸眼で計測して、「このレンズにしてみましょうか」と大枠が決定。そのレンズを取り付けた検眼用のメガネをかけて、用意された画像などを見て「違和感があったら別のレンズに入れ替え」などをしながら、最終的に最適なレンズを決定する。確かにあの流れによく似ている。

こうして2回目のアライメントも終了。ここで得られた情報を、さらにZE8000に反映させるため、この日はZE8000は持ち帰れない。

final側がさらに最適化を施したデータをZE8000に書き込み、完成したZE8000を家に後日送付してくれる。このため、1回目にfinalへZE8000を持ち込んでから、完成した自分ダミーヘッドを受け取るまで1カ月ほどかかってしまうが、その間の代替品を借りる事も可能だ。

自分ダミーヘッド仕様になったZE8000を聴いてみる

自分に最適化されたZE8000

受け取った“自分に最適化されたZE8000”を聴いてみよう。

外観にほぼ変化はないが、スティック部分の側面に「JDH」というマークが入る。また、イヤーピースが上位モデル「ZE8000 MK II」に付属する、新形状のイヤーピースに変更となる。この新イヤーピースは、自分ダミーヘッドの料金に含まれている。

JDHというマークが入った

自分ダミーヘッドのパラメーターを適用したZE8000を、スマホと接続すると、スマホアプリ「finalCONNECT」が「お、このイヤフォンは自分ダミーヘッドデータが入ったZE8000だな」と認識してくれ、アプリの画面内に「自分ダミーヘッド」の設定画面が新たに登場する。

アプリに「自分ダミーヘッド」の設定画面が新たに登場。左上にもロゴマークが現れる

この画面で「OFF」ならば通常のZE8000、そして「Reference」を選択すると、最適化された音になる。なお、「RF None」と「RF+n」というボタンも用意されているが、これはReferenceのパラメーターに対して、自分ダミーヘッドに対するバーチャル音環境の音響物理的影響度の想定を少しだけ変えたパラメーターで、「RF None」は影響度想定を少し減らしたもの、「RF+n」は逆に増やしたもの。曲によって変えても良いようになっている。

まず「Reference」をONにする前に、OFF状態、つまり“通常のZE8000”がどんなサウンドなのかを先に書いておこう。

私はZE8000に対して、以前から「密閉型スピーカーみたいな音の完全ワイヤレス」という印象を持っていた。短い言葉で言うならば「高域から低域まで正確な音」「特に低域に誇張が無く、低音の解像度が非常に高い」という印象だ。

スピーカーでオーディオを楽しんでいる人には説明不要だと思うが、ブックシェルフでもフロア型でも、最近のスピーカーはバスレフ型が多い。スピーカーユニットの背後から出る音を有効活用して、穴から空気を出して低音を増強する仕組みであり、小さなスピーカーでも迫力のある低音が出せる方式だ。しかし、やりすぎるとボワボワと、制御されていない低音が不必要に膨らむ事になる。

別にZE8000が密閉型だというわけではないが、聴こえる音が非常に密閉型っぽい。低域に余分な膨らみが無く、例えばアコースティックベースの弦が震える様子なども驚くほどシャープに聴き取れる。finalではZE8000のサウンドを、高精細な8K映像に例えて「8K SOUND」としてアピールしているが、確かに、意識を向けると非常に細かな部分まで聴き取れるZE8000の特徴を表現した言葉としてはピッタリだと感じる。

ただ、ナチュラルで高精細は良いのだが、逆に言うと音に派手さがまったく無い。マニアな人は感動するかもしれないが、「地味な音」と感じる人も多いだろう。

……というのが、私の“通常のZE8000”に対するイメージだ。

で、先程の「Reference」をONにしてみたのだが、本当に「はぁ!?」と声が出てしまうほど音が変わる。いや、「ナチュラルで高精細」なZE8000の音の方向性はそのままだが、在来線で走っていたその線路を、新幹線で10駅くらいぶち抜いて次の世界に行ってしまったような音がする。

“霧が晴れる”というのが、表現として適切だろう。OFFの状態で聴いていた「ダイアナ・クラール/月とてもなく」も、アコースティックベースの細かな描写や、ボーカルの口の動きの生々しさが感じられたのだが、Reference ONにすると、自分の視力が一気に倍増したようにベースの弦がブルブル震える様子や、口の中の湿気さえ見えるように情報量が爆発的に増える。

驚くのは、イコライザーで「ちょっと高域持ち上げたんでしょ?」とか「コントラスト強めただけでしょ?」みたいな変化ではまったくない事だ。幸いアプリで簡単にON/OFFできるので、何度も切り替えながら聴いてみると、ONにする事で高域がキツくなったり、低域が持ち上げられたりといった変化が一切感じられない。純粋にSN比だけが上がり、霧が晴れたようにより細かな音が聴き取れるようになり、音場はより静かになり、それによって立体感も高まり、より生々しく音楽が楽しめる。つまり、ONにする事で犠牲になる部分がまったく無い。まさに魔法のような変化だ。

なお、ZE8000にはデジタル信号処理の演算能力を限界まで高めることで、音質を向上する「8K SOUND+」モードがあるが、ReferenceをONにすると、8K SOUND+モードも強制的にONになる。そのため、Reference ON状態では、通常よりもバッテリー持続時間が30~60分短くなってしまう。だが、Reference ONの音を聴いてしまった以上、もはやOFFにするという選択肢は頭の中から消えてしまうだろう。

自分ダミーヘッドを作ると、なぜ音色が良くなるのか

確かに音は激変した。自分ダミーヘッドを作ると、どうしてここまで音が良く聴こえるのか。チーフサイエンティストの濱﨑公男氏と、細尾満社長に聞いてみた。

左からチーフサイエンティストの濱﨑公男氏、細尾満社長

1つ目の疑問は「上半身や耳の形状を測定」と「音色の最適化」の関連だ。

冒頭に書いたように、他社の最適化では、頭部伝達関数を求める事で“音の方向”がよりわかるようにして、空間オーディオの効果を高めるものが多い。finalの自分ダミーヘッドサービスは、音の方向ではなく“音色を良くする”最適化を謳っている。

濱﨑氏は1つの例を挙げる。「例えばサントリーホールでウィーンフィルの公演があるとします。特等席で聴きたいけれど、残念ながら行けない。でも聴きたい……と思った時に、どうするか。自分と寸分たがわぬ、まったく同じカタチのアバターをその席に置いてもらい、その耳が聴いた音を、後で自分が聴けば、物理的にはホールで聴いた音をそのまま聴けることになります。しかし、そのアバターが細尾の体であった場合、音だけもらっても、私がその場で聴くはずだった音とは違う音になってしまいます」。

重要なのは、音の位置だけの話ではなく“音色”についても同じだという事だ。「バイオリンがあそこにいる、という“音の方向”は、左右の耳で聴き取る時間差、レベル差を測定して再現すれば、だいたいわかるようになります。しかし、“音色”をどう再現するかになると、とたんに技術的に難しくなる。そのため、今までどこも手を出してこなかった領域でした。今回、我々はそこに手を出したので、とても苦労しました(笑)」(濱﨑氏)。

チーフサイエンティストの濱﨑公男氏

音は、頭や上半身、耳などに当たることで、回折・反射して変化する。それによって“音色”も変化する。どのように変化するのか、また、その音色を聴いた人間が、脳でどのように感じるのか? という部分まで踏み込むと、難問になる。例えば、ストラディバリやクレモナといったヴァイオリンの名器の音色の違いを、ヴァイオリン奏者は聴き分けられるが、初めて聴いた人には難しい。経験も関与しているわけだ。

しかし、“個人最適化”であればそこまで踏み込む必要はない。理論的には難問であっても解決策はシンプルで、ユーザーとまったく同じ形状のアバターに音を当ててみて、その体によってどのように音が変化したのかを測定し、再生時に再現すれば良い。測定と計算の精度を上げれば、その人が日常的に聴いている音色を、イヤフォン再生でも再現できる。そんなある意味“力技”で音色を最適化したのが、今回の自分ダミーヘッドサービスというわけだ。

ダミーヘッドから得られた音響物理パラメーターを、ZE8000に書き込むと、ZE8000が再生する音が変化する。では、実際にどのように適用し、変化させているのか。音のカスタマイズと聞くと、頭に浮かぶのは「アプリのイコライザーで音をいじる」行為だ。もしイコライザーを少しいじるくらいであれば、それで55,000円は高く感じてしまう。

しかし、詳細を聞くと、文字通りイコライザーとは根本的に違うものだった。

「デジタル信号処理で一般的なのはイコライザーですが、あれはIIR(無限インパルス応答)フィルターを使っています。しかし、自分ダミーヘッドではIIRを使わず、FIR(有限インパルス応答)フィルターを使っています」(濱﨑氏)。

詳細は省くが、IIRは計算の処理量が比較的小さく、非力なDSPでも処理できるほか、計算結果がすぐに出るため、変化した音を確認しながらリアルタイムに調整できる。逆にFIRフィルターは処理量が大きく、時間がかかるため、リアルタイムでは処理できないという違いがある。

濱﨑氏は「FIRには伝達関数という概念があり、“あるところ”から“あるところ”へ変化するという処理が得意です。IIRのイコライザーでは音を聴きながら調整できますが、それは、“誰かが聴いて”チューニングするという意味でもあります。自分ダミーヘッドの場合は、そもそも“誰かが聴いて”チューニングできない。お客様に最適化されているので、私がそのイヤフォンを装着しても、お客様と同じ音を聴くという事が物理的に不可能なのです」と語る。

実際に濱﨑氏は、他の人向けに最適化したイヤフォンを聴いてみた事があるそうだが、「自分のイヤフォンとあまりに違った音で、聴けたものではありませんでした。しかし、音響物理量を比較しても、たいして違いはありませんし、イコライザー的に考えてもそれほど大きな違いは出ません。ですので、自分ダミーヘッドをイコライザーを使って適用するのは無理なのです」。

「第三者が聴いて判断したり、調整できない。ですから、アルゴリズムをキッチリ作って、あるものがあるものへと、どう変化するかを測定して、それをイヤフォンに入れる事しかできないのです」(濱﨑氏)。

通常のイヤフォンは、メーカーのエンジニアなど、最終的な音を決める人がチューニングして完成する。しかし、人によって音色の聴こえ方が違うという地点からスタートしている自分ダミーヘッドでは、測定されたユーザー以外が最適な音を聴く事ができない。2日目に、最適化されたイヤフォンをユーザー自身が聴いてチェックする工程があるのは、“そもそも第三者がチェックできない”からなのだ。

「2日目のチェック(ABCからしっくりくるものを選ぶ)で一番理想的なのは、最初から最後まで全部スキップされる事ですね。それは1日目の測定で、ほぼ理想的なスキャンができていたという証拠でもあります」(濱﨑氏)。

細尾満社長

細尾社長は「スピーカーであれば、複数人で聴いて良いとか悪いとか言えますが、自分ダミーヘッドイヤフォンの場合は、良いかどうかは本人しかわかりません。しかし、最適化がうまく行っているかどうかは、聴いた方の感想からわかります」と語る。

「社内スタッフが最適化した時もそうだったのですが、皆、言語化に困っているんです。“良くなったんだけど言葉で説明できない”と。高音がとか低音がとか、今までのオーディオ用語が失われます。それが最適化の効果なのですが、逆に、言語化が難しいので体験していない方に良さを伝えるのが難しい。ZE8000で“8K SOUND”と言い出したのは、そうした経緯もあります」。

さらに細尾社長は、ZE8000自体が“今までの一般的なイヤフォンの作り方と大きく違う”と言う。「通常はスピーカーで聴く音をイヤフォンでも再現しようと、無響室にダミーヘッドを置いてHRTF(頭部伝達関数)を導き出したり、ハーマン・カーブ(ハーマンが規定したターゲットカーブ)を使い、試聴を積み重ねて完成させますが、ZE8000はまったく違います」。

「音色の理想を追求したらどうなるかというのを、演繹(えんえき)的に、こうなったら、こうなるはずだという机上の計算をキチンとやっています。計算でちゃんと閉じられたら、その答えが当たっているという事になります」。

「そこから生まれたイヤフォンを聴いて、違和感を感じたら、計算そのものは間違っていないので、途中のどこかにミスがあります。実際にZE8000の開発でも、計算は間違っていなかったけれど、途中の変換のところにもっと良い方法があった……という事もありました」(細尾社長)。

濱﨑氏は、従来の音色の追求方法には問題があると語る。「音色の追求において、“感性”や“好み”と言い出すと、わけがわからなくなってしまいます。特に音色ではそうなりがちです。例えば、ギターはこういう音でなければ、シンバルがもっとこう聴こえるようにと調整すると、その曲では良いかもしれませんが、別の曲ではダメという事もよくあります。ですので、感性や好みで、音色を追求するのはやめましょうというのがZE8000と自分ダミーヘッドの特徴です」。

自分ダミーヘッドが切り開く未来

自分ダミーヘッドサービスの測定結果。今回は音色の追求に活用されたが、音の方向の再現、つまり“空間オーディオ”の効果を高める事には使えないのだろうか?

細尾社長は「使えます。と言いますか、音の定位と音色は研究としては一体のものですので、既に定位の再現という研究の成果はゲーム用イヤフォンのVRシリーズなどに活かしています。もともと定位の研究からスタートしていまして、その過程で音色の重要さに気が付き、自分ダミーヘッドに至ったというイメージです。好きなアーティストの声がかすれているのに、定位だけが良くてもダメじゃないですか(笑)。愛を持ってコンテンツを楽しむには、音色もしっかり再現できなくてはいけないのです」。

“音像定位”に特化したゲーミングイヤフォン「VR500 for Gaming」

一方で、自分ダミーヘッドを“空間オーディオ”で活用するためには、空間オーディオのコンテンツがもっと増える必要があると細尾社長は言う。「現状ではコンテンツの96%が2chと言われています。いまの空間オーディオはギミックで空間オーディオを作っているものが多い。ゼロから空間オーディオとして録音しているものは限られています。本当は我々が録音からやりたいのですが、そんなにお金がないので難しいですね(笑)」

濱﨑氏も「2chでも空間再現はできますが、本当に正確に再現するにはバイノーラル録音をキッチリやるしかありません。コンテンツがそろってくれば、やりたいと考えておりますので、そのための準備だけはしておこうという状態ですね」と語る。

現在、自分ダミーヘッドの対象イヤフォンはZE8000のみだが、上位機の「ZE8000 MK2」向けには自分ダミーヘッドサービスは実施しないのだろうか? また、自分ダミーヘッドを適用したZE8000と、同様に適用したZE8000 MK2を比較した場合、音に違いはあるのだろうか?

細尾社長は「自分ダミーヘッドは、対応できる人数に限りがあるので現在はZE8000のみとなっていますが、将来的にはZE8000 MK2向けにも展開したいと考えています」と語る。クオリティについては、「ZE8000 MK2では、ハードウェア的にZE8000から改良したところがありますので、その部分の違いは出ますが、どちらも自分ダミーヘッドを適用すれば、音色としてはほぼ同じところに着地すると思います」とのこと。

気になるのは、自分ダミーヘッドの今後だ。例えば、自分ダミーヘッドを適用できるヘッドフォンや、そうした信号処理が可能なポータブルアンプのような製品は登場するのだろうか? また、さらに飛躍してスピーカーへ参入の可能性はあるのだろうか?

細尾社長は「いずれも検討や研究は進めています」と言う。「ZE8000の中身を拡大して、ハイエンドオーディオにふわさしい製品を作りたいと考えています。ちょっと開発が遅れていますが(笑)。今回の自分ダミーヘッド的な技術も入れたものにしようと考えています。特にハイエンドな製品の今後の進化は、個人最適化の方向だろうと考えています。スピーカーもいずれは手掛けたいと思っています。やるのであれば、他の誰もやってないような、真似のできない製品にしたいですね」。

山崎健太郎