藤本健のDigital Audio Laboratory

第788回

進化するオーディオ解析と立体音響。Inter BEEで見た音楽制作の今

11月14~16日の3日間、幕張メッセでInter BEE 2018(2018 国際放送機器展)が開催された。今年で第54回目となったInter BEEには過去最多となる1,152社・団体が出展し、登録来場者も過去最多の40,839名を記録している。

Inter BEE 2018が行なわれた幕張メッセ

例年通り、大きなスペースを占めるのは映像系だが、プロオーディオ系も出展社数が333、小間数では402と国内最大規模。業務用の大規模なものからDTM用途のものまで、さまざまな製品、技術、サービスが披露されていた。その膨大にあった中から、個人的に面白かったものをいくつかピックアップして紹介したい。

映像だけでなく、オーディオも国内最大規模の出展数

注目のデジタルオーディオ解析技術

Inter BEEは規模が大きいだけに、見る人によって、今年の傾向や印象も大きく変わってくると思う。映像系だと4K8Kや、中には16Kまで……と見えるのかもしれないし、VRやARのさらなる躍進と見えるかもしれない。またデジタルオーディオだとDante関連製品が飛躍的に増えてきたとも感じられたとは思う。そうした中で、筆者が今年のトレンド的に感じたのがデジタルオーディオの解析技術の進化とイマーシブオーディオへの活用。実際に、どんなものがあったのか見ていこう。

数カ月前、米iZotopeのオーディオ修復ソフト、RX7がオーディオを解析して、ボーカル成分やドラム成分、ベース成分を抜き出してさまざまな処理ができることが話題になっていたが、それに対抗するような形で登場してきたのが、アイルランドのAUDIO SOURCE REという会社による「DEMIX PRO」というソフト。

AUDIO SOURCE REの「DEMIX PRO」

同社はコーク工科大学から生まれたベンチャー企業とのことだが、オーディオ信号の解析を得意としているという。ここが開発したDEMIX PROはWindowsおよびMacのAU、VST、AAXのプラグイン環境で動作するソフトで、2chのステレオ信号からボーカル成分やドラム成分を簡単に抜き出すことを可能にしている。CDなどからリッピングしたWAVファイルに対し、このプラグインを適用するだけで、ボーカルやドラムを分離してくれる。しかもボーカルにおいてはボーカルの主成分とリバーブ成分を別々に取り出してくれるので、残響を少なくするとか増やすといったことも簡単にできてしまう(DEMIX PROのデモ動画)。

このボーカルやドラムの分離処理はクラウドで行なわれているためPC側に負担はかからないが、裏側でアップロード、ダウンロードするため、処理時間はある程度かかるようだ。一方で、ボーカルやドラムを分離した残りの成分に対してはスぺクトラルエディタを利用することで、ベースを分離させたり、左右の音の違いなどをもとにギターやピアノなどをある程度分離することも可能だという。曲の構成にもよるが、普通のステレオ2chのオーディオを7~8トラックのマルチトラック信号に分離できるというから、かなり応用範囲も広そう。本当に実用的に利用できるのかぜひ一度試してみたいと思っている。なこ、このDEMIX PROは国内ではクリプトン・フューチャー・メディアのSONICWIREを通じて12月上旬予定でダウンロード販売が行なわれ、価格は8万円台になるという。

ボーカルやドラム以外の成分はスぺクトラルエディタを利用

立体音響&イマーシブオーディオの最新動向

ポーランドの会社、ZYLIAが出した「ZYLIA Portable Recording Studio」は球型のUSB接続のマイクを用いたレコーディングシステム。この球の中には19個のマイクが入っており、これと付属のソフトウェアを用いることで、非常に面白いことができるのだ。

球形のマイクを使った「ZYLIA Portable Recording Studio」

あらかじめ何の音を録音するのかソフトウェア側で指定しておくのだが、たとえばスタジオの中でアコースティックギター、ボーカル、ベースの3つの音を出すのであれば、そのように指定する。そのうえで、この球型マイクをスタジオの適当な位置に置いて録音を行なう。その後、解析処理すると、ギター、ボーカル、ベースとマルチトラックデータとして分離される。ここではデジタル・サウンド・プロセッシング・アルゴリズムとマイク・アレイ・テクノロジーを組み合わせることで、こうした分離を行なっているというのだが、なかなか不思議なところ。

どのパートの音を出すかあらかじめ指定しておき、解析するとマルチトラックデータとして分離できる

この分離を行なうソフトのみがバンドルされている「ZYLIA STANDARD」(75,000円前後)と、Ambisonicsコンバータなどをセットにした「ZYLIA PRO」(120,000円前後)の2種類があり、メディアインテグレーションから年内をメドに発売される予定だ。

「ZYLIA STANDARD」と「ZYLIA PRO」

Avid Technologyのブース内でデモが行なわれていたのはスペインDSpatialの製品「DSPATIAL REALITY」。これはPro Toolsでイマーシブ・オーディオ制作を行なうためのプラグインシステム。つまり5.1chや7.1chはもちろん、ハイトポジションのある22.2やDolby ATOMS、Auro-3D、さらには2chのヘッドフォンで聴くバイノーラルサウンドまで作り出せるというツール。たとえばボーカルのトラックの音を上下左右に配置したり、それを回転させてみたり、自由に動かすことができる。

DSpatialの「DSPATIAL REALITY」

単に動かすだけでなく、音を動かす際に残像をつけてみたり、ドップラー効果を実現するなど、よりリアルなサウンドの動きを作り出すことができるのだ。また空間表現においてはIR対応のリバーブも搭載されており、さまざまな場所のIRデータも収録されている。そしてユニークなのは「ONE MIX , ALL FORMAT」というキャッチフレーズの元実現させている互換性。前述の通り、これで立体音響をミックスしていくわけだが、出力側の設定を22.2chにすれば、そのフォーマットで、5.1chに設定すれば5.1ch、さらには2chバイノーラルに設定すれば、そのフォーマットで出力されるのがポイント。何のフォーマットを使っているかを意識することなくミックスできるのがDSPATIAL REALITYの特徴。なお、どのフォーマットに対応しているかなどによって、3種類のラインナップに分かれている。

音を動かす際に様々な効果が付加できる

そのDSPATIAL REALITYとは少し考え方は異なるが、やはり立体音響を作り上げていくプラグインとして「IEM Plug-in Suite」というソフトが、シンタックスジャパン、エムアイセブンジャパン、ジェネレックジャパン共同のブースで展示されるとともに、セミナーが開催されていた。

IEM Plug-in Suite

このプラグインはWindows、MacさらにはLinuxのVSTで動作するものなのだが、驚くべきはこれが完全に無料で入手できるオープンソースのソフトウェアであるという点。Ambisonicsに準拠した手法で立体音響を作っていくソフトであり、そのAmbisonicsについて長年研究を続けているオーストリアのグラーツ国際音楽大学が開発したという。

Ambisonicsに準拠した手法で立体音響を作成

AmbisonicsではW-X-Y-Zの4chで立体空間を実現させる1次、8chで実現させる2次、16chで実現させる3次……と次数を増やすことで、よりリアルな立体空間を実現できるようになるが、IEM Plug-in Suiteでは最大64ch=7次まで扱うことが可能。IEM Plug-in Suiteでは、どの音をどこに配置するかを決めていくのだが、何次まで扱えるかはDAW側の1つのトラックで何chまで扱えるかによって変わってくる。つまり1トラックでモノラル、ステレオではなく最低4ch扱えることが利用条件となるが、2次の8ch扱えるものも限られているのが実情。その中で、7次の64chまで扱えるのがシェアウェアのDAW、Reaperであり、IEM Plug-in SuiteはReaperとの相性がベストとのこと。

8ch、16chと増やしていくことで、リアルな立体空間を実現

セミナーではGENELECのスピーカーを上に5つ、水平に6つの計11ch設置した環境で音を出していたが、ソフトを操作するとリアルタイムに音が動き回るのを実感できた。なお、IEM Plug-in Suiteというとおり、EQ、ディレイ、リバーブなど、イマーシブオーディオに対応したさまざまなエフェクトプラグインもセットとなっており、これが無料で入手できるようになっている。

11chスピーカーで再生
エフェクトプラグインもセット

イマーシブオーディオをネット配信、ヘッドフォンでも立体的な音

そのイマーシブオーディオを通信回線を用いて実現するというデモも行なわれた。ヒビノがデモしていたSmart Hallは今回のInter BEEで一番スゴイと感じたものだ。これは空間×空間をネットワーク接続して、双方向でリアルタイムに一体感・臨場感を味わえるというシステム。具体的には、幕張メッセのブースと30km離れた六本木にあるスタジオを接続し、セッションを行なうというもの。

ネット配信でイマーシブオーディオの遠隔セッションを行なうデモ
幕張のマリンバと、六本木のパーカッションで遠隔セッション

幕張側はマリンバ、六本木側にはパーカッションがあり、2人でセッションしていく。ここで使われている通信回線は専用線ではなくNTTのフレッツ光とIIJのSMFsx。帯域保障などもない一般的な回線ではあったが、まったく違和感のないセッションができていた。ヤマハが以前から研究を行なっているNETDUETTOとも近いもので、一番問題となるレイテンシーが片道15msec程度であるというのもNETDUETTOと同様。ただし、臨場感を実現させるため、双方向にマルチチャンネル接続しているのが大きな特徴。六本木から幕張には16chが、幕張から六本木には8chのオーディオがそれぞれ48kHz/24bitで送られているので、まさに目の前でパーカッションを叩いているように感じられる。ただ、ここでオーディオと映像は同期させてはおらず、音を優先にしているため、映像が微妙に遅れるのは仕方ないところだろう。

幕張のマリンバと、六本木のパーカッションで遠隔セッション
双方向にマルチチャンネル接続して、臨場感のある音で楽しめる

そのほかにもMIDI信号も送られており、六本木で叩いたMIDIパッドの信号が幕張に届き、ここにあるXV-5080というRoland音源で音を鳴らし、そのオーディオ信号をモニターチャンネルを通じて六本木に戻す形で演奏が行なわれていた。当然15msec以上のディレイはあるはずだが、演奏者側にも違和感はないと話していた。もちろん慣れの問題はあるとは思うが、未来を感じさせてくれるデモとなっていた。

以前記事で何度か取り上げてきたサラウンド・イマーシブオーディオをステレオヘッドフォンで実現することができる技術「HPL(Head Phone Listening)」。22.2hや5.1chといったサラウンドミックスをPCソフトウェアを用いて2chのバイノーラルサウンドに変換するというもので、その変換をハードウェアで実現するシステム「RA-6010-HPL」が参考出品されていた。

サラウンドを2chのバイノーラルにハードウェアで変換する「RA-6010-HPL」

これはサラウンドスピーカーのない環境でヘッドフォンモニタリングができるという使い方はもちろん、野球やサッカーなどのスポーツ実況中継や音楽番組などを放送する現場で、サラウンドから2chにリアルタイムに変換するといった使い方も可能にしてくれる。MADIおよびAES/EBUの入力があるので、これらを用いてデジタル入力を行ない、内部のFPGAを使ってリアルタイムに2chを生成する流れ。HPLのフィルタはアコースティックフィールドールドのものが使われているが、機材自体はレゾネッツ・エアフォルクが開発している。

「小岩井ことりが聴いた音」をバイノーラルで再現

ここまで紹介してきたデジタル技術とはちょっと異なるが、バイノーラルサウンドをよりリアルに実現するためのイヤフォンマイクとして参考出品していたのは、須山歯研のFitEar。声優の小岩井ことりさんの耳型をとったものが展示されており、これは本人にとってピッタリ合うイヤフォン。その外側には高精度なコンデンサマイクが取り付けられており、これでレコーディングできるようになっている。

FitEarが出展していたバイノーラル用イヤフォンマイク

このコンデンサマイクは48Vのファンタム電源が必要となるため、ここではTASCAMのリニアPCMレコーダーと組み合わせたシステムとしてデモが行なわれていたが、小岩井さん本人は自分の聴いた音を不思議なほどにリアルに録音・再生できるレコーディングシステムだと話していたようだ。須山歯研の代表取締役の須山慶太氏によると、まだコンデンサマイクに何を使うのがいいのかなど試行錯誤中で、すぐに製品化が予定されているわけではないという。現モデルもファンタム電源の消費電力が大きいため、リニアPCMレコーダーのバッテリーの持ちが悪く別途バッテリーを用意しないと使いにくいのが難点とのこと。とはいえ、カスタム型のバイノーラルマイクは一部の人にとって高いニーズがありそうに思えた。

イヤフォンの外側に付いたマイクで録音

立体音響系を中心に見てきたが、そのほか気になった製品もいくつかピックアップしてみよう。高精度クロックジェネレーターで著名なブルガリアのAntelope Audioが参考出品していたのは「AMARI」というDSD対応のUSB DAC兼オーディオインターフェイス。

Antelope Audioが参考出展した「AMARI」

スペック的にはステレオ2chながらPCMでは768kHzのサンプリングレート、DSDでは11.2MHzまで対応したマスタリングコンバーターという位置づけ。PCとはUSB 3で接続する形になっており、ワードクロックの入力も装備している。

背面

RMEのADI-2 PROにも近いコンセプトのようだが、AMARI内にはFPGAが搭載されており、PC側でコントロールすることでマスタリングエフェクトも利用可能になっているという。価格や発売時期などはまだわからないが18万円程度になるのでは、と話していた。

PCでコントロールしてマスタリングエフェクトも使える

ズームが出展していたのはハンディ・ビデオレコーダーの「Q2n-4K」。以前記事でも紹介したことがあるQ2nの4K版で、Q4nと同様、内蔵の高性能マイクを用いてリニアPCMレコーダーとしても使える仕様。広角150度のワイドレンズであった点でもQ2nと同様だが、フルHDではなく4Kとなっただけに画角を狭めて焦点を絞っても高画質で見せることができるのがポイント。単3アルカリ電池2本で駆動し、124gという軽量であるのも魅力の一つだ。

ズーム「Q2n-4K」

TASCAMが出していたのはダブルカセットデッキの「202MKVII」。なぜ、いまの時代にカセットデッキ? と思ったが、担当者によれば放送局などを含めた業務用としての利用と、アーカイブを目的とした高音質デッキであるとのこと。昔ながらのダブルカセットデッキと同様、片方で再生し、片方で録音するダビング用途はもちろんだが、片方で再生しながら、もう片方をSPECIAL再生モードに設定すると、その音は外に出さずモニター端子だけで聴けるため、事前に頭出しをすることができるのが特徴。アナログで出力できるだけでなく、USB端子経由でPCにデジタルで送ることも可能。この場合最大で48kHz/24bitでの伝送が可能。なお、Dolby B相当のノイズリダクションシステムも搭載されている。

TASCAMのダブルカセットデッキ「202MKVII」

そのほかにもFOSTEXからは4インチの小さなアクティブスピーカー「NF04R」が11月下旬発売予定(1本50,000円)で発表されたり、SoundCraftからはUSB搭載のミキサー「NotePad」シリーズ3機種、5ch入力の「NotePad 5」(13,000円程度)、8ch入力の「NotePad 8」(17,000円程度)、12ch入力の「NotePad 12」(21,000円程度)が発表され、来年1月ごろをめどにヒビノから発売される。

FOSTEXのアクティブスピーカー「NF04R」
8ch入力の「NotePad 8」

PreSonusからは192kHz/24bit対応のオーディオインターフェイス「Studio 2|4」(16,800円程度)が今月下旬にエムアイセブンジャパンから発売される予定で参考出品されていた。

PreSonusのオーディオインターフェイス
「Studio 2|4」の背面

このように、今年のInter BEEでは、興味深い製品、サービスがいっぱいあったので、今後さらに詳しい情報が入ったり、製品を入手できれば、この連載で取り上げていきたい。

藤本健

 リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。  著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。Twitterは@kenfujimoto