藤本健のDigital Audio Laboratory

第578回

MP3圧縮で“失った音”をリアルタイムで確認する方法

変換後の差分を聴ける「Fraunhofer Pro-Codec 2」を試す

Fraunhofer Pro-Codec 2

 2012年4月の記事「第504回:MP3圧縮で、どんな音が失われるのか」で圧縮の結果消えた成分を取り出して、その音を聴いてみるという実験を行なった。ビットレートを変えることで、明らかに抜け落ちる成分が違うことがわかって驚いたが、同様に感じた方も多かったようで、大きな反響があった。

 この時は、Cubaseを利用してオリジナルの音と圧縮結果の逆相を立ち会わせることで、差分を取り出していたのだが、実はそんな苦労をしなくても簡単にそれを実現できるツールがあった。それが英Sonnoxが出すSonnox Oxford PluginシリーズのFraunhofer Pro-Codec 2というものだ。これは、リアルタイムにMP3やAACへのエンコードをして、モニタリングできるとともに、その差分を聴いたり、ビットレートの違いによる音の変化をその場で確認できるという非常に便利なツールなのだ。

 一般コンシューマが使う製品ではなく、マスタリングエンジニア、レコーディングエンジニアなどが利用する業務用のシステムではあるが、47,460円という価格なので、趣味の世界においても十分手の届く範囲のもの。どんなツールなのかを紹介していこう。

Sonnox OxfordのFraunhofer Pro-Codec 2とは

 DAWを利用しているユーザーであれば、ご存じの方も多いが、Sonnox Oxfordは業務用としても広く使われているプラグインを開発しているメーカー。もともとはソニー系列のSony Oxfordとしてレコーディングスタジオ向けの大型コンソールなどを開発していたメーカーだったが、2007年にソニーグループから独立して、Sonnox Oxfordとして展開している。ソニーグループ時代から、大型コンソールに搭載されていたEQをプラグイン化したSony Oxford EQなどを出しており、早い時期から多くのスタジオで採用されていたが、現在同社が出すプラグインはEQ、リミッタ、ダイナミクス、リバーブ……と数多くのものが出ている。

 また、いわゆるエフェクトだけでなく、ノイズリダクション用のプラグインもヒスノイズなどを取るDeNoiser、ハムノイズ除去用のDeBuzzer、クリックノイズ除去のDeClickerなどを出しており、これらはインターネット社の波形編集ソフトSound it!などにも採用されていることから、このDigital Audio Laboratoryにおいても何度か取り上げたことがあった。

 そのSonnox Oxfordが出しているもう一つのヒット製品がFraunhofer Pro-Codec 2というもの。その名前からも想像できるとおり、これはMP3やAACなどを開発したところの1つであり、オーディオ圧縮に関する特許をいろいろ持っているドイツFraunhofer IIS研究所と組んで開発したソフトだ。使用環境としてはWindows、MacのハイブリッドとなっておりVST、AudioUnits、RTASのぞれぞれのプラグイン環境で動作する。また対応しているコーデックとしてはMP3、MP3HD、AAC-LC、HE-AAC、HE-AAC2、HD-AACの5種類(詳細は下表の通り)。Mac版においてはMastered for iTunesに対応したApple AAC iTunes Plusというコーデックも用意されている。

コーデック 主な仕様
MP3/MP3サラウンド チャンネル数 MP3: モノラル、ステレオ、MP3サラウンド5.1ch
サンプリングレート(kHz) モノラル/ステレオ:8、 11.025、12、16、22.05、24、32、44.1、48
MP3サラウンド: 44.1 & 48
ビットレート モノラル:8-320kbps(VBR/CBR)
ステレオ:16-320kbps(VBR/CBR)
MP3サラウンド5.1ch: 128-320kbps(VBR/CBR)
mp3-HD チャンネル数 モノラル、ステレオ
サンプリングレート(kHz) 32、44.1、48
ビットレート VBR(ロスレス)
AAC(AAC-LC/HE-AAC) チャンネル数 モノラル、ステレオ、5.0ch、5.1ch
サンプリングレート(kHz) AAC-LC:11.025-96
HE-AAC:22.05-96
HE-AAC v2:22.05-48
ビットレート(ステレオ/44.1kHz) AAC-LC: 96-320kbps(VBR/CBR)
HE-AAC: 16-128kbps(VBR/CBR)
HE-AAC v2: 18-56kbps(VBR/CBR)
AAC(MPS) チャンネル数 5.1ch
サンプリングレート(kHz) AAC-LC: 44.1、48
HE-AAC: 44.1、48
ビットレート(ステレオ/44.1kHz) AAC-LC: 192-320kbps
HE-AAC: 48-128kbps
HD-AAC チャンネル数 モノラル、ステレオ、5.1ch
サンプリングレート(kHz) 44.1、48、88.2、96、176.4、192
ビットレート VBR(ロスレス)

「エンコードしながら再生できる」メリット

 このソフトの最大の特徴は、リアルタイムにエンコードしながら、再生できるという点なのだが、それがどういう意味を持つのかを少し考えてみよう。

iTunesのCDインポート(エンコード)設定画面

 ご存じのとおり、通常MP3やAACにエンコードするには、iTunesなどのソフトに搭載されているエンコーダを用いてWAVやAIFFなどの非圧縮状態から変換が行なわれている。DAWの機能としてAACやMP3のエンコードエンジンが搭載されているケースもあるが、基本的に性能が変わるわけではないようだ。DAW搭載のものを使えば、直接24bit/96kHz、24bit/192kHzでレコーディング、ミックスした環境からMP3やAACを生成できるので、効率的にはいいようだが、一度24bit/96kHzや24bit/192kHzでのWAVでステレオにミックスダウンしたデータを作ってから、iTunesなどでエンコードしても、エンコーダが同じであれば、同じファイルが生成される。

 ここで課題になるのが音質。iTunes Storeなどの音楽配信での比率が大きくなってきている今、やはり最終的な製品である圧縮オーディオファイルの音質をどのように向上させるかがテーマであり、そこにこだわっているエンジニア、アーティストも少なくない。以前、このDigital Audio Laboratoryでも、元のWAVファイルの高域をEQで少し持ち上げてからエンコードすると、MP3データの音質が、オリジナルのWAVに多少近づく……といった実験を行なったことがあったが、これは、まさに手探りに操作となる。つまりEQ調整を行なったデータを作成し、エンコードしてできたファイルをモニターして確認し、気に入らなければ再度調整をして……と非常に手間のかかる作業なのだ。そのことは、DAWから直接エンコードしたデータを書き出すことで多少の時間短縮にはなるが、大変な作業であることには変わらない。

 そのためメジャーアーティストの作品であっても、圧縮音源専用のマスタリングまで行なっているケースはまだ少ないのが実情であり、CD用に生成したWAVファイルをそのまま配信業者に納品し、配信業者側がエンコードを行なっているケースも少なくないようだ。この点については、以前moraに対して行なったインタビューなどでも明らかだ。

 こういった問題の解決に大きな力を発揮しそうなのが、今回紹介するFraunhofer Pro-Codec 2なのだ。前述の通り、Windows、Macの環境で、VST、AudioUnits、RTASのプラグインとして動作するソフトとのことだったので、ここではWindowsのCubase 7.5にVST-64bitのプラグインを組み込んで使ってみた。

WindowsのCubase 7.5にVST-64bitのプラグインを組み込んでテストした

 使い方はとっても単純。マスタートラックの最終段にこのプラグインを入れるだけ。これによって、Fraunhofer Pro-Codec 2を通った音がCubaseのモニター出力から聴くことができるのだ。この使い方自体はほかのDAWであってもまったく同じである。

 では、実際に組み込んでみると、デフォルトではAAC-LCの256kbpsのCBR=固定ビットレートの設定で起動してくる。この状態でCubaseのプロジェクトを再生すると、エンコードされた音でモニターでき、その周波数解析した結果がリアルタイムにグラフで表示されるのだ。

デフォルトではAAC-LC/256kbpsのCBRに設定されている
Cubaseのプロジェクトを再生すると、エンコードされた音でモニターでき、周波数解析結果がリアルタイムで表示

 普通なら、前述のような手間をかけてプレーヤーソフトで再生して初めてエンコードした音が聴けるのに、これはかなり便利。もちろん、リアルタイムエンコードといっても、計算にはある程度の時間がかかっており、画面左下のTOTAL DEALYを見ると、2624サンプルという遅れが生じているのだ。ここでは44.1kHzのデータを再生しているので時間に換算すれば1/44100*2624=59.5msecの遅れではあるが、この程度の遅れは実用上、無いに等しい。

プラグインの前段でEQ調整し、エンコード結果をリアルタイムで聴ける

 たとえば、このプラグインの前段にEQを設定し、これをいじってみれば、リアルタイムにAAC-LCでエンコードした結果が聴けるのだから、画期的といってもいい効率のよさだ。

 続いてコーデックの設定画面を開いてみる。ここでビットレートの設定を変更することもできるし、CBRかVBRかの設定もできる。また演算にかける時間を変えて、エンコード品質を調整することもできる。こうしたパラメータはどれも一般のエンコーダーにあるパラメータと同じであり、それによる違いがすぐに確認できるのもうれしいところだ。

ビットレート設定
CBR/VBR選択
エンコード品質調整

 そしてコーデックの種類も前述の通り、6種類の中から選択できるようになっているのだ。この中にはmp3HDやHD-AACのようなロスレス圧縮も含まれている。ロスレスなので、音質的に変わらないのが原則であるため、これをモニターすることにどれだけの意味があるか分からないが、そこにこだわりを持っている人もいるようなので、試してみる価値はあるのかもしれない。

 ちなみにコーデックやビットレート、品質などの設定を変えると演算にかかる時間も変わるようで、設定によってTOTAL DELAYの数値も変わってくる。

コーデック選択
設定によってディレイの数値が変わる

MP3エンコードで“消えた音”をモニタリング。ブラインドテストも

 エンコードされた結果をモニターをする上で、なかなか面白いのは、いろいろな比較ができるようになっているという点。

右上にあるINPUTとCODECのボタン

 まずは画面右上にあるMONITORというところにINPUTとCODECというボタンがあるが、これをINPUTに切り替えるとエンコードする前の音に切り替えることができる。音質的にはこのプラグインをオフにするのと同じではあるが、プラグインのオン/オフとは意味合いが大きく違う。前述の通り、このエンコーダを通すことでディレイが生じているため、再生中にオン/オフすると音が瞬間的に途切れてしまうが、INPUTとCODECの切り替えならスムーズな切り替えができる。もっともプラグインエフェクトのバイパスのオン/オフを行なうのとは同じことであるが……。

 さらに面白いのは、やはりこのエンコードによって消えた音をリアルタイムにモニタリングできるという点。この音は、初めて聴くとなかなか衝撃的であるが、このプラグインでは、画面右側のDIFFというボタンを押すとその消えた音、つまり入力音と出力音の差分がモニターできる。再生中に、エンコーダやビットレートを変えることもできるから、実際のエンコード結果を聴き比べるだけでなく、その差分を聴き比べることによって、違いが誰でもよく分かるようになるのは嬉しい機能だ。

 また、違う設定の音を簡単に比較できるように、ここには最大5つまでの設定を並べて切り替える機能も用意されている。さらに、その中の任意の2つをブラインドテストできるAB評価機能などが利用できるのも面白いところだ。

DIFFというボタンを押すと、入力音と出力音の差分がモニターできる
5つまでの設定を並べて切り替えて比較できる
任意の2つをブラインドテストできるAB評価機能も

 試しに、エンコーダによって、音にどのくらい違いがあるのか、実験した結果をここに載せてみよう。

音声サンプル
オリジナル sample.wav(4.2MB)
MP3/128kbps-CBR sample1.wav(4.2MB)
MP3/128kbps-CBR(差分) sample2.wav(4.2MB)
AAC/256kbps-VBR sample3.wav(4.2MB)
AAC/256kbps-VBR(差分) sample4.wav(4.2MB)
※編集部注:編集部ではファイル再生の保証はいたしかねます。
再生環境についての個別のご質問にはお答えいたしかねますのでご了承下さい
OFFLINE ENCODEの画面

 ここでは、すべてをWAVで掲載したが、それはCubaseの書き出し(バウンス)機能によって作ったものだからだ。

 これではせっかく設定しても、目的のフォーマットのファイルにならないが、もちろん、そのための機能も用意されている。それがOFFLINE ENCODEというもの。これは、現在の設定のまま、WAVファイルをエンコードしてMP3やAACに変換するというもの。これを使うには、あらかじめWAVファイルを用意した上で、それをこのプラグイン上にドラッグ&ドロップするというものであり、従来通りの手間がかかるのは事実。ただ、すでに最適な結果が作れることはわかった状態での作業だから、このひと手間は仕方ないところだろう。

 できる限りいい音の圧縮オーディオを生成したい、というのであれば、導入してみる価値のあるツールといえるのではないだろうか。

藤本健

 リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。  著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。EPUBマガジン「MAGon」で、「藤本健のDigital Audio Laboratory's Journal」を配信中。Twitterは@kenfujimoto