本田雅一のAVTrends
第216回
“ステレオ”から“空間オーディオ”へ。変わるオーディオ機器の基準
2023年8月17日 00:00
正直に告白すると、ソニーが360 Reality Audio(360RA)を始めた頃、立体音響がここまで広く聴かれるものだとは想像していなかった。当時の360RAはイヤフォンやヘッドフォンでのバーチャル技術も実装されておらず、リスナーを取り囲む巨大な装置だったからだ。
しかし現在、アップルがDolby Atmosを用いて始めた“空間オーディオ”も含めると、立体音響技術で制作、あるいはリマスターされている作品は急増している。厳密には、360RAと(音楽作品向けの)Dolby Atmosには、小さくはない技術的な差異もあるが、立体音響フォーマットの音楽配信に追加料金が必要ないこともあり、自然にユーザーに受け入れられている。
ここでは“空間オーディオ”と表現するが、実は音楽作品を制作しているエンジニアたちも、空間オーディオを支持している人が極めて多い。これは5.1chのマルチチャンネル化を目指したSACDやDVD-Audioではほとんど見られなかった現象だ。
なぜなのか?
もちろん、イヤフォンやヘッドフォンだけで立体音響を楽しめる技術が発達し、手軽に立体音響を楽しめるようになったことも大きいが、実はもっと根本的な部分でイノベーションが起きている。
そしてそれは、オーディオ製品の作り方やユーザーの評価視点も変える、大きなイノベーションでもある。なぜなら“ハイファイステレオ”という、従来の価値観が変化する節目になるからだ。
“ステレオ”と“空間オーディオ”の決定的な違い
長い間、親しまれてきている“ステレオ”録音は、二つの音声チャンネルを用いることで立体的な音を表現している。この情報には立体的な音場空間の情報も含まれているため、良質な録音(適切なミックスやマスタリング)で収録されたステレオトラックを、高い忠実度のシステムで再生させると、エンジニアが狙った音場がそこに生まれる。
初期のステレオ録音には、薄っぺらい左右に音源が並んだだけの作品もないわけではないが、ほとんどのステレオ作品には音場空間を描く明確な意図がある。
とはいえ、理想的な環境で高品位の再生を行なうことは簡単ではない。
だからこそ、収録されているステレオのトラックを、いかに忠実に再生するか、セッティングも含めて奥深さがあり、ちょっとしたスピーカーの配置などの環境で音場は変化する。
これはチャンネル数が5.1に増えても同じことで、音の方向感や情報の密度は高めやすいものの、本来狙った音場を再現するには“高忠実性”が求められる。突き詰めた時の難易度はステレオの場合と大きくは違わず、コストや手間、システムの規模は3倍になるのだから、思い起こせばマルチチャンネルオーディオが流行らなかったのも当然のことだろう。
しかし、それは空間オーディオでも同じではないのか?
そう思うかもしれないが、実は空間オーディオの場合は異なる。ステレオや5.1ch音声は、決められた位置に置かれたスピーカーが理想的な環境下で忠実にトラックを再生することを前提にマスタリングされているが、空間オーディオの場合はそもそも“最終的に再生すべき音”が記録されているわけではないからだ。
音源そのものの音に位置や音響特性、エフェクトなどのメタ情報がストリーム情報として付与されており、スピーカーユニットから出力される音声は“システム構成ごとに異なる”。
この違いは、“適切にスピーカーを設置し、理想的な音響特性の部屋”という前提のもとに忠実再生を行なえばエンジニアがこだわって作り込み、アーティストが確認した音楽を楽しめるという従来の価値観とは決定的に異なる。
“ただ一つの正解”がない世界
この違いは製品の選び方、評価の軸を大きく変えてしまうものだ。
そう感じ始めたのは、第2世代HomePodの発売直後にApple TV 4KとHomePod(ステレオペア)のセットでソニーのサウンドバー「HT-A7000」と比較評価をしていた時のことだ。Apple TVを組み合わせているのは、HDMIのeARC機能を用いて映像の音を再生させるためだが、ここでちょっとした、しかし大きな違いに気付いた。
HT-A7000が音楽再生時のモードを持ちつつも、音楽再生でも映像作品の音であっても一貫した音質、音場表現なのに対し、HomePodは音楽配信を再生させた場合と映像作品の音声を再生させたときでバランスが異なっていたからだ。
HomePodは音楽再生時には、あまりローエンドの帯域を欲張らず、音楽表現をバランスよく再現しようとする。これは空間オーディオ(Dolby Atmos)の場合も同じで、仮想的な立体音響ではあるものの帯域ごとのエネルギーバランスが変化しないよう配慮されている。
ところが映像作品のDolby Atmosトラックを再生させると、中央に位置するセリフのキレが増し、音場全体が広くなるなど描写の手法が変化する。音の移動感も明瞭となり、ふんわりと音場全体の雰囲気、空気感を作ろうとする音楽再生時とは異なる。
ふとHomePodをステレオペアではなく、1台でDolby Atmosの音楽を再生させてみたが、二台の場合ほどではないものの、それなりに空間を感じさせるような描写だ。
元々、HomePodは(miniも含め)機械学習により再生楽曲に応じた、帯域分割しての圧縮やイコライジングなどを行なっている。それはまるで、iPhone内蔵カメラが機械学習で現像の最適化(逆光で撮影した人物、背景の建物、空の全てが適正露出で現像されるなど)を行なっていることにも似ている。
つまり忠実再現よりも、その場でよりよく聴こえるようレンダリングするのだ。そのためにHomePodは周囲からの反射音をモニタリングする指向性マイクを6つ内蔵している。
この時はソニーがコンベンショナルな音作りをしているのに対し、アップルは“コンピュテーショナル・オーディオ”を指向しているのだろう程度にしか考えていなかった。
しかし、SONOS(ソノス)がシングルボディで空間オーディオ再生が可能な、「Era 300」を発表。この製品の取材を通じて、空間オーディオ対応トラックの増加がオーディオのトレンドを変えつつあり、それはいずれAVシステム向けのサラウンドシステム(上位AVアンプも含む)にまで影響することがわかってきた。
なぜなら、ステレオ再生は“高い忠実度”と“リスニング環境の整備”の追求が全てで、それを追求することが“正解”を導く鍵だった。しかし空間オーディオの質を高める手法は多様であり、コストや構成に応じて柔軟に対応する必要がある“正解がひとつではない”。
自由度の高い”空間オーディオ再現”の手法
しかしAV機器ファンの皆さんならば、Dolby Atmosの再生には定義されたスピーカー配置があるはずでは? と疑問に思うかもしれない。
確かにDolby Atmosデコーダでは、5.1.2ch、7.1.4ch、9.2.6chなど、いくつかのリファレンスが想定されている。そうした配置を基本に、AVアンプの音場測定機能でスピーカーのレイアウトと位置補正を行なって楽しんでいるという方もいるはずだ。
ところがこれらは“フォーマットとしてのDolby Atmosの制約”ではない。
たとえば劇場向けのDolby Atmosシステムは、シアターごとにカスタム設計されたレイアウトでスピーカーが埋め込まれる。スピーカーの配置や数、特性など様々な設定を通じて「どのスピーカーからどんな音を出すか」がレンダリングされる仕組みだ。これは他のオブジェクト型オーディオフォーマットでも同じだ。
その最も簡素な形式が、イヤフォン、ヘッドフォンなどで楽しむ、2つのドライバで再現する手法だ。信号処理の質が高まり、ヘッドフォンやイヤフォンでも空間オーディオ対応モデルならば、驚くほど立体的に音場が感じられるようになった。
Era 300の空間オーディオ再生もこれと同じだ。
この製品は、ミッドウーファーが左右斜め前方向に配置され、中程度の指向性を持たせたホーンを備えるツイータが左右方向に、そして前方中央には指向性の広いツイータが置かれる。さらに上方向に強めの指向性を持つホーン型スピーカーを配置し、天井からの反射で高さを表現しようとしている。
これらの“ツール”を駆使して、Dolby Atmosのレンダリングを最適化しているのだ。
使えるツール(異なる指向性のユニットを異なる方向にセット)が増えれば、描くことが可能な音場の自由度も上がり、空間の描写能力も高まる。Era 300の場合も、ステレオペアにすることにより、実際にはステレオはもちろんだが、空間オーディオ体験のグレードが大幅に向上する。
“空間オーディオ”で見つめ直す製品の評価
空間オーディオという言葉はアップルが広めたものだが、考え方、フォーマットとしては360RAも共通だ(表現力は360RAの方が高いが、製作者以外はあまり意識しなくていいだろう)。そうした括りで紹介すると、現時点で空間オーディオを配信しているのはApple Music、Amazon Music Unlimited、Deezer、TIDALだ。TIDALは日本での事業を行なっていないため、国内での選択肢は3つということになる。
対応機器も限られている。例えばApple Musicの場合は、アップル(およびBeatsブランド)のオーディオ製品やコンピュータ端末、およびソノスのSONOS Arc、Beam2、Era 300でしか利用できない。
一方で当初は1,000曲から始まったApple Musicにおける空間オーディオの配信だが、旧譜も含めて対応楽曲は意外なほど増え続けている。残念ながら邦楽については対応楽曲は多いとは言えないが、洋楽の新譜はメジャーどころなら対応していることが多い。
また意外にクラシックの名盤が空間オーディオで配信されていることが少なくない。今後、日本でもサービス開始が予定されているApple Musicのクラシック音楽専用アプリもあることを考えれば、クラシック音楽ファンも注目すべきだ。
その理由はすでに書いたように、アーティストやエンジニアが空間オーディオを新しい表現手段として受け入れているからだ。信号処理の進化で体験価値が高まったことに加え、5.1ch時代よりも“ステレオとの違い”を実感するケースが増えたこともあるのだろう。
加えて音質に関しても、ほとんどの視聴環境においてハイレゾ配信よりも空間オーディオの方が体験価値が高まる。“音質とは何か”の定義にもよるが、ハイレゾフォーマットは“ステレオトラックを収録する容れ物”がグレードアップしたに過ぎない。
筆者のリスニングルームでは「LINN Klimax DSM+Akubarik Aktiv」というシステムで音楽を楽しんでいるが、同時に、SONOS Era 300×2台とSONOS Sub miniを併設してみた。
この構成でハイレゾ音源を聴き比べると(SONOSは48kHzはダウンサンプルされる)、ハイレゾの情報量云々の前に、情報量や質感(S/N感や音域バランスなどトータル)で圧倒的に前者が勝る。Era 300は価格を考えれば十分に良い出来だが、格の違いは如何ともし難い。
ところがEra 300で同じ楽曲の空間オーディオ版を再生させると、もちろん品位という面では基本的な格の違いはあるものの、音場の立体感が大幅に増し、また情報量も増えて聞こえるようになる。体験の質が大きく向上するのだ。
アトラクティブなEDMでも実感できるが、一番驚いたのがオーケストラの演奏だ。
デュダメルが指揮しているLAフィルのアルバムは数多く空間オーディオ化されているが、試聴用におすすめなのがクライバー指揮の「こうもり(序曲)」。1976年収録の演奏だが、空間の広さ、立体感などがステレオの時とは全く異なる豊かさへと昇華される。
低価格システムでも豊かな音場描写力
もちろんトータルの音質で、LINNのシステムを上回ることはない。しかし、およそ500万円のシステムと20万円程度(サブウーファー無しなら15万円未満)のWi-Fiスピーカーということを考えてほしい。ひたすらにステレオ再生の忠実度を高めるためのコストをかけなくとも、豊かな音場空間を描写できるようになるのだ。
さらに余談になるが、LINNのシステムを活かす形でシアターシステム用のDolby Atmos 5.1.4ch構成で同じ空間オーディオ楽曲を再生させると、当然ながら本格的なAVシアターのシステムがあらゆる面で圧倒する。これもまた当然のことだ。
しかし、“空間を描く音場の設計図を含む音声ストリーム”である空間オーディオが今後増えていく、より楽しめるものになっていくと考えて製品を選ぶ、あるいはメーカーの視点では製品を企画するようになると、これまでのオーディオの価値観は変わっていくだろう。
言うまでもないことだが、Dolby AtmosなどオブジェクトオーディオのフォーマットにはAVシステムの方が先に対応してきた。空間オーディオのトレンド変化は、映像を楽しむスタイルの変化にもつながるものだ。
Apple TV、Amazon Prime Video、Netflix、Disney+、U-NEXTといった主要な映像配信サービスはAVアンプなどのサラウンドシステムを通さない場合でも、空間オーディオを視聴できる環境を用意することで立体音響を楽しめる。
背景とトレンドへの言及でかなりの長文を割いてしまうことになったが、今回のコラムを書き上げるまでに、上記以外にSONOS Arc + Era300×1 + Sub mini、SONOS Era 300単体(1台のみでの空間オーディオ再生)、Amazon Echo Studioなどを既存システムと比較してきた。
またメーカー視聴室ではあるが、ソニーの波面合成技術を応用した新型AVアンプ「STR-AN1000」での音場補正機能と360RA再生なども試した。
総じて言えるのは、比較的、低価格なシステムでも音場描写が大幅に高まり、音楽的な表現力が上がると言うことだ。具体的なレビューについては別の機会に書きたいが、純粋なオーディオ機器としても、AVシステムとしても、空間オーディオで制作される楽曲の動向は製品選び、商品企画の双方に大きな変化をもたらしそうだ。