藤本健のDigital Audio Laboratory
第945回
スタジオが大聖堂に!? ヤマハ音場再現&立体音響技術てんこもり「AFC」とは
2022年6月20日 10:02
先週、ヤマハは銀座スタジオにおいて、イマーシブなオーディオ体験を実現するAFC(Active Field Control)製品の発表会を開催した。AFCシステムが一体どのようなものなのか、今一つ想像できないまま参加したのだが、発表会はかなり興味深い内容だった。
今回の発表会は「AFC Enhance」と「AFC Image」という2つの技術を紹介するもの。どちらも2021年にリリースしていたのだが、コロナ禍で人を集めての発表会がしづらい期間が続いたため、今になってのお披露目となったようだ。
筆者個人的にはちょうど1年前、同じ銀座スタジオでAFC Enhanceのデモを見てかなり驚いたのだが、今回改めて詳細な説明を受け、ようやくその概要をつかむことができた。実際どのような技術なのか、またどんなことが実現できるのか、紹介していこう。
空間固有の音響特性を再現する「AFC Enhance」
AFC Enhance、AFC Imageといっても、おそらく大半の方は、何のことなのかさっぱり分からないと思う。そこで、まずは今回プレゼンテーションを行なっていた、ヤマハミュージックジャパン PA営業部 マーケティング課の石橋健児氏によるデモをご覧いただきたい。
手に持ったパーカッションを叩くだけのデモだが、AFC Enhance機能オフの状態からオンの状態に切り替えると、大きな反響が加わったことが分かるだろう。ただ、これを見ても「リバーブをかけただけでは?」と思う方もいるかもしれない。
でももう一度よくご覧いただきたい。筆者は、ステージの一番前で、iPhoneを使い、iPhone内蔵マイクで動画撮影しただけだ。そして、パーカッションの前にはマイクも何もない状態である。不思議に感じないだろうか。
さらに、その後に行なったバイオリンの演奏デモがこちらだ。
ご覧いただくと分かる通り、前半はAFC Enhanceをコンサートホール(のモード)にした状態でバイオリンを演奏したもの。そして後半は、大聖堂にした状態で演奏したもの。どちらも生のバイオリンであって、マイクやピックアップなど何もない。筆者とは3m程度の距離で演奏しており、もちろん聴こえてくるのは、生のバイオリンそのものの音だが、音場はコンサートホールだったり、大聖堂だったりと、全然違った雰囲気になるのが分かるのではないだろうか。
いずれもiPhone内蔵マイクだけで録音した音なので、現場で聴いたものとはやはりニュアンスは異なる。現場では、はるかに立体的で、まさにコンサートホールもしくは大聖堂にいるような感じで前からも横からも後ろからも反響があった。
その後、石橋氏は会場で少しトリックを仕掛けていたことを告白。実は来場者が会場についたその時点でAFC Enhanceがオンになっていて、少し反響のある部屋の状態になっていたのだ。実際、先ほどのパーカッションを叩いた前半も実はAFC Enhanceがオフな状態でなく、少し反響のある状態になっていたのである。そして、試しに「本当にオフにしてみます」とAFC Enhanceを切ると、会場全体の響きがかなりデッドな状態になり、違和感を感じてしまうほどだった。
先ほどはステージでのパーカッションやバイオリンの演奏であったが、この響き、音場はは会場全体が持っているものであり、たとえば客席で拍手した際もコンサートホールなのか、大聖堂なのかによって響き方が変わってくるし、客席から「わぁぁ!」と声を上げれば、それがまるで大聖堂の中のように響くのだ。
何が起こっているのか。
それがAFC Enhanceという技術を使った音場再現なのだが、この銀座スタジオは、ヤマハ銀座店の地下2階にあるスタンディングでキャパ200人というそれなりの広さを持った公演会場。このスタジオを見上げると、照明が埋め込まれていると同時に数多くのスピーカーが設置されているのが分かる。
壁面に埋め込まれたスピーカーも含め、全部で53台あるという。さらに、小さくてよくわからなかったが、指向性マイクおよび無指向性マイクも数多く埋め込まれており、これらを使って人工的に反響音を作り出していたのだ。
もう少し具体的にいうと、“音場合成方式”と“室内音場制御方式”という2つの技術を使って、コンサートホールや大聖堂の反響を実現する。
通常であれば、上図のように、演奏者の音が直接観客に届くと同時に、天井や壁面からの反射音が届き、音場が構成される。しかし、このAFC Enhanceの音場合成方式では、演奏者からの音は指向性マイクを通じて捉えられ、それを元にしてシミュレーションするコンサートホールや大聖堂の初期反射音に相当するものが、複数のスピーカーから出力されるのだ。
ちなみに、シミュレーションする音場は、コンサートホールや大聖堂のほかにもリサイタルホールやスモールシンフォニーホールなど、6種類のテンプレートが用意されているとのこと。
さらに、初期反射音が合成された部屋の音を無指向性マイクが拾い、それをプロセッシングした上で残響音として鳴らし、響きを増強していくという。この際、EMR(=Electronic Microphone Rotator)なる技術を用いてハウリングさせずに、音場を制御していくそうだ。もちろん、すべてデジタルプロセッサで処理をしており、それが製品となっているのだという。
もっとも、このAFC Enhanceは突然誕生したものではなく、ヤマハが長年培ってきた技術とのことで、そのスタートは1969年に遡るという。その後AAS EnsembleとかYume-Hibikiなどと名前を変えつつ、性能を向上させてきた。現在は日本国内はもちろん、世界中のホールなどの施設で導入されているそうだ。
最大128個のオブジェクトを自在に操る「AFC Image」
AFC Enhanceとは別に、もう一つ披露されたのが前述したAFC Imageというものだ。
これは立体空間の中に音像を定位させたり、音像を移動させたりするもの。これもかなり不思議な技術だったためデモをビデオで撮影してみたのだが、ビデオではその意味合いを捉えることができなかったので、言葉で説明してみたいと思う。
まず行なわれたデモは、先ほどのバイオリニストが、アコースティックのバイオリンではなく、ヤマハのサイレントバイオリン(=エレクトリックバイオリン)を使って演奏を行なった。
ご存じない方のために簡単に紹介しておくと、サイレントバイオリンはエレキギターなどと同様、アンプにつながない状態で弾くとわずかな弦の音がするだけ。アンプやPAに接続することで、大きな音を出すことができるという楽器だ。
最初はAFC Imageオフの状態で演奏すると、3mほど離れたところから、小さく生の弦を弾く音が聴こえてくる。ここからフェードインしていく形でAFC Imageを上げていくと……、明らかに奏者の手元から音が聴こえてくるのだ。もちろん、このサイレントバイオリンにアンプやスピーカーが搭載されているわけではない。ここからワイヤレスでPA側に信号が送られているだけなのに、そこから聴こえてくる。もちろん、普通に見ていればまったく違和感はないわけだが、その後のデモに度肝を抜かされた。
AFC Imageの設定をそのままの状態にして、奏者がステージ上手に移り、そこで演奏を始めたのだ。すると、なんと音はステージど真ん中の先ほど弾いていた位置から聴こえてくる。その後、エンジニアが3Dパンナーを使って音の位置を中央から右側へ動かしていくと、バイオリンの音が右へと動き、バイオリニストの手元から聴こえるようになったのだ。
そう、これがAFC Imageの技術だ。これも会場に埋め込まれた53台のスピーカーをコントロールして実現している。つまり、音像がどこにあるかを平面的、立体的に自由に指定することができ、まるでそこから音が出てくるようにする技術なのだ。この際、特定の座席からのみ、それを実感できるわけではない。どの席にいても、指定した位置から音が聴こえてくるのはとても不思議だ。
デモの後半では、奏者がステージを降り、客席を取り囲むように、会場を一周歩きながら1曲演奏していったのだが、その際、AFC Imageをコントロールするエンジニアが画面を指でタッチしながら奏者の位置を指定していくと、まさにそこに音がついていくので、まるでサイレントバイオリンから音が出ているかのように感じられたのだ。
デモはバイオリン1つだったが、音の発信元をオブジェクトとしてとらえているため、AFC Imageでは最大128個のオブジェクトを配置できるとのこと。しかも、各オブジェクトの位置を視覚的に簡単に指定できるのが、面白いところであり、画期的な部分だという。
ここで、従来のライブハウス、コンサートホールなどでの音響についての課題が示された。
もしLRのステレオでミックスすると、例えばボーカルやサックスプレーヤーなどがステージで左右に動いた場合、それによってパンニングを左右に振ると、中央で見ている人にとっては違和感はない。しかし、左右のスピーカーの前にいる人にとっては、音量の大小が激しくなり、全体バランスが大きく崩れてしまう。
それを避けるためにモノミックスにすると、センター付近の定位が偏り、視覚と聴覚の方向不一致が発生して臨場感が著しく低下してしまう。
これを5chとか7ch、9chのようなマルチチャンネルスピーカーにすれば、その方向から音を聴こえさせることは可能だが、とくに奏者が動き回るような場合、それをリアルタイムにオペレーションしていくのは非常に困難という状況になる。また、マルチチャンネルスピーカーだと、スイートスポットが限定され、多くの座席でその方向からバランスよく音が聴こえるようにするのは難しくなってしまう。
もしオブジェクトベースで3D座標を用いて表現できるとなると、音をまさに立体的に配置可能となり、スイートスポットは広く、よりリアルに聴こえるようにすることができる。また、そのパンニング操作もずっと簡単になる、というのだ。ちなみにXYZの3軸での操作となるので、DAWにオートメーションとして記録していくことも可能となる。
実際、普通に見ていると何の違和感もないけれど、仕組みを知れば知るほど不思議に見えてくるAFC Imageであったが、今後いろいろな場面でこうした技術が使われてくるのだろう。
なお、こうした多くのスピーカーを使わなくても、ヘッドフォンで簡易的に再現するバイノーラルのシステムも用意されている。実際、会場でもヘッドフォンを使ってデモを行なっていたが、バイノーラルへの畳み込みだと、どうしても機器による違いや個人差もあるので、そこまでリアルには感じられなかったのが正直なところだ。
ぜひ、将来的にはこのバイノーラル技術を発展させ、AFC Enhance、またAFC Imageがより手軽に扱える世界がやってきてくれることを期待したい。