西田宗千佳のRandomTracking
第421回
もっと「空間に響くような音楽」を! ソニーが提案する「360 Reality Audio」とはなにか
2019年1月9日 08:00
1月7日(現地時間)、ソニーは、米ラスベガスでプレスカンファレンスを開催した。そこで発表になった、目玉の一つが、音楽コンテンツ向けのオブジェクトオーディオ規格「360 Reality Audio」だ。
製品化はまだ先で、CESの段階では「技術・コンセプト展示」となっている。だが、その狙いや中身などを、ある程度詳しく聞くことができたのでお伝えしたい。ご対応いただいたのは、ソニー・R&Dセンター 基盤技術研究開発第1部門オーディオ技術開発部 知念徹さんだ。
オブジェクトオーディオとはなにか
冒頭で述べたように、360 Reality Audioは「オブジェクトオーディオ」のための規格になる。ここで改めて、オブジェクトオーディオとはなにか、をおさらいしておこう。
現状、ほとんどの音楽コンテンツはいわゆる「チャンネル」をベースに構築されている。ステレオなら左右の2ch、サラウンド規格なら5.1chや7.1chといったところだ。出力されるスピーカーの数(チャンネル)を定めてオーサリングされ、その上で視聴する。
非常にシンプルで広く普及したやり方だが、問題もいくつかある。スピーカーのサイズや配置、聴く人が座る位置などよって音の感じ方が大きく変わってしまうため、統一的な体験の維持が難しいことだ。特にこれは、家庭と映画館の違いなどで発生しやすい。
また、基本的には同じ水平面にスピーカーを並べることを想定しており、音を上や下など、立体的な場所に配置するのが難しい。
そこで登場したのが「オブジェクトオーディオ」である。音を「発生する座標と移動するベクトル」の情報として記録し、出力時、再生する場所のスピーカーの数などに合わせて、音の出方を「レンダリング」して再生する。音を配置する際、立体空間の中に置くようにすれば、当然音は上から聴こえるように感じられる。音楽でいえば、演奏する楽器の位置から音が聴こえるようになるわけだ。
こうすることで、映画館のような広い場所でも違和感なく聴けて、効果音を「上から」感じることもできる。映画などでは「Dolby Atmos」や「DTS:X」などの規格でお馴染みになり、最新のホームシアターでは必須の要素となりつつある。
だが、オブジェクトオーディオについては、映画などは実は後発で、ゲームが先に進んでいた。ゲームの空間内に、CGと同じように音源を配置し、自分のいる位置からどう聞こえるかを再現するのは、いまやあたりまえの要素になった。ゲームの場合特に、臨場感や効果音をリアルに、没入感のある形で実現するのであれば、オブジェクトオーディオの考え方は必須になる。今後広がるVRについても同様だ。
13のスピーカーで360度をカバー。音楽のための360度オーディオ
とはいうものの、ソニーが提案する360 Reality Audioは、これらとはちょっと狙いが違う。
「VRなど、非常に可能性が高いのは理解しているのですが、今回はまず音楽の体験にフォーカスしています」
知念さんはそう語る。
360 Reality Audioの場合、360度全体の空間に配置されたオブジェクトを、13個のスピーカーで構成される空間で再生する。
体験してみると、通常の音楽再生と異なり、より明確に広がりのある空間を感じられるのが面白い。Dolby Atmosなどでは上から降るような音も感じられるが、自分よりちょっと下からも音が出るように感じられる。
こうした再生は、13個スピーカーを配置するリッチなシステムだけで成立するものではない。ヘッドフォンやサウンドバーでも大丈夫だ。特にヘッドフォンの場合には、いわゆるバーチャルサラウンドヘッドフォンと同じように、頭部伝達関数(HRTF)を使って擬似的に、ヘッドフォンの2つの音源からでも実現できる。体で音を全体に感じる……というわけにはいかないが、頭を中心として360度から音がやってくる感じは十分に得られた。
MPEGによるオープンフォーマット、ソニーは「システム」で儲ける
なぜソニーがこうした技術を提案するのか? それを考えるためには、今の音楽ビジネスの状況を知っておく必要がある。
音楽は順調に音質を上げてきた。だが、ある意味究極ともいえる「ハイレゾ」は、なかなか大きく利用量を伸ばせずにいる。一方、現在の音楽消費の中心はストリーミング・ミュージックであり、音質とは違う軸での体験向上が中心になっている。
360 Reality Audioが狙うのは、音質の向上とはまた別の軸での音楽体験の向上である。
360 Reality Audioが「音楽向け」とされているのは、ストリーミング形式による提供を強く意識しているためだ。
次の表は、360 Reality Audioで現状想定されている、オブジェクト数とビットレートの関係である。レベル1からレベル3まで3段階で構成され、640kbpsから1.5Mbpsのビットレートが使われる。オーサリングの段階で各レベルのデータを作り、配信側で利用者の通信速度に合わせてデータを切り替えていくことで、スマートフォンのように通信環境が大きく変わる可能性があるデバイスでも、安定的に体験できる。
逆にいえば、360 Reality Audioでは再生時に必ず「レンダリング」という処理が必要になるので、再生側にはそれなりの処理性能が求められる。といっても、「現在主流のスマホで十分に余裕をもって処理できる程度の負荷」であり、さほどリッチな環境である必要はない。
これまで360 Reality Audioを「フォーマット」と書いてきたが、実のところ、これはソニーの独自フォーマットというわけではない。標準化団体であるMPEGが定めたオープンフォーマットである「MPEG-H 3D Audio」に基づくものだ。
360 Reality Audioと名付けられてはいるものの、同じ形式で配信するのはどの企業でもできる。ではソニーの強みはどこか? 「オーサリングから配信まで、一貫した環境を提供できることにあります」と知念さんはいう。
オブジェクトオーディオでは、当然ながら、これまでとは違う形でのオーサリングが必要になる。ソニーはすでにその環境を構築し終えており、PCベースのオーサリングツールを提供できる状況にある。それを配信するためのシステムもあるし、スマートフォンで再生するアプリを開発するためのSDKも用意されている。フォーマットそのもので利益を得るのではなく、フォーマットを使って配信するために必要なツールと技術を揃え、それらを一気通貫に提供することで収益を得るビジネスモデルなのである。
現状では、Desser・nugs.net・Qobuz・TIDALといったサービスが「プレミアムサービス」の形で提供することが公表されている。
現場での反響も良好であるようだ。
「試していただいているレコーディングエンジニアの方々からは、非常に良い手応えを感じています。一般的な楽曲については『今までのやり方よりもマスタリングが簡単になる』との評価もいただいています。音の伝え方が違うので、無理に音圧を稼ぐために工夫する必要がなくなるからです」(知念さん)
立体的に音につつまれる音楽体験、という意味では、期待したくなるのは「ライブ」音源の提供だ。これももちろん視野に入っている。すでに、アメリカの大手プロモーターであるLive Nation Entertainmetとの協業も発表されている。
「色々とテストしていますが、非常に良好で、面白い効果が得られています。一方で、どこにマイクを配置して収録を行なうのか? PAとの連携をどうするのか? という点では、まだ色々な検討と試行錯誤も必要です。しかしその結果として、いままでのライブ音源よりも臨場感・没入感がありつつ、演奏している音やボーカルの位置、ライブ会場でのPAの状況などを含めた違いを体感できるコンテンツが作れると期待しています」(知念さん)
冒頭で述べたように、CESで行なわれたのは「技術・コンセプト展示」であり、具体的なサービスや製品の公開はこれからだ。だが、製品までの展開はそう遠くないだろう。サラウンドによるライブ配信などのサービスはすでにいくつか存在するが、まだまだニッチである。一般的な音楽配信でのマルチチャンネル利用も少数派である。ソニーが360 Reality Audioをリーズナブルに各企業へ提供する準備が整えば、そうした新しいリッチな音楽コンテンツの世界の普及に対し、一定のインパクトを与えられるのではないか。結果として、音楽の楽しみ方が多様化することを期待したい。