【バックナンバーインデックス】



第200回:iPodに最適なMP3を作る その2
~ 128kbpsでは表現しきれない「16kHzの壁」 ~



 休日が入ったり、ニュースが入ったりで2週空いてしまった「iPodに最適なMP3を作る」。2回目となる今回は、前回出した結論「ビットレートは128kbpsで十分」を再検証する。



■ 128kbps以上にしても高域は出ないのか?

 前回、MP3のエンコーダ3種類を比較した結果、どうもiTunes搭載のものは、動作が怪しいという話をした。また、LAME系のGOGOエンジンを利用し、128kbps、192kbps、256kbpsの3種類でエンコードしてみた結果、ピークの波形を見ると確かにビットレートが高いほど高域が出ているというのがわかるが、実際に音を聴くとそれほどの差を感じないということも書いた。

 この点について、いろいろな反論メールなどもいただいたが、実際GOGOエンジンでは、そうであったし、だいぶ以前の実験ではFraunhofer-IISのエンジンでも似た音であったという記憶がある。もちろん、前回の結論はあくまでも第1回目の実験での結論であって、それが最終的結論ではない。実際、どうすればいいのかは、これから追っていく。

 またiTunesユーザーから、「128kbpsの音は最低、192kHzとは明らかに音が違うのがわかる」といったメールが多く、iTunesのエンコーダでは160kbpsや192kbpsと、128kbpsとの音質差が大きいことは確かなようだ。実際に聴感上は、128kbpsよりも160kbpsや192kbpsの方が高域が自然になり、GOGOやFraunhofer-IISの結果と近くなる。逆に言えば、iTunesの192kbpsの音とGOGOなどの128kbpsと音の差があまりないということでもある。

 こうした事実を踏まえ、ひとつ疑問に感じるのが、本当にビットレートを128kbps以上にしても高域が出ないのか、ということ。確かにピーク上は出ているもののグラフを見ても不自然な動作であり、正確な音は出ていない。これがMP3の限界ということなのだろうか? それを確かめるため、単純な実験としてサイン波を20Hz~22.05kHzまで動かすスウィープ信号を作り、それをMP3にエンコードした際、各バンド域がどう扱われるのかをチェックした。



■ 「午後のこ~だ」の192bpsには問題も

 ここで再度使うのがGOGOエンジンを搭載した「午後のこ~だ」。同じスウィープ信号を128kbps、192kbps、256kbpsのMP3でそれぞれエンコードし、それを改めてデコードしてWAVに変換したものをグラフ表示させたのが以下のものだ。

128kbps 192kbps 256kbps

 これを見ると、128kbpsでは明らかに15.5kHz以上の音は出ていない。マスキング効果によって、目立たない音を消してファイル容量を圧縮するというMP3ではあるが、単純にサイン波だけであっても高域においてはバッサリと消し去られてしまうようなのだ。それに対し、192kbpsでは20kHz程度まで出るようになり、256kbpsなら22.05kHzまで切れずにしっかり出る。ということは、うまく使えばもっと高域まで音が出せる可能性があるというわけだ。

 ただ、ここでひとつ気になったことがある。192kbpsの高域での挙動が、128kbpsの場合と何か違うのだ。これまでも似た現象を経験したことがあったのだが、このWaveSpectraの動きを見ていると、ある周波数の高さまで行ったところで、折り返して下がっていく。

SoundForgeで見ると、高域に上がっていく最後の辺りが妙な形に

 つまり本来グラフは時間が経過するに連れて、右へ右へと進んでいくはずだが、あるところから左へ進みはじめるのである。20kHzあたりで減衰しきったところからで、ちょうど反対にグラフをなぞるように進みだすのだ。

 試しに、MP3データをデコードしたデータを波形編集ソフトであるSoundForgeで見ると、高域に上がっていく最後の辺りが妙な形になっていた。これはまさにエイリアス現象ではないか。つまり、ローパスフィルターを使わないで43kHzのサンプリングレートで録音した音のようになっており、21.5kHzを超える音が出ないどころか、21.5kHz以下の音に悪影響を与えてしまう。


ローパスフィルタの設定は見当たらない
 たとえば22kHzの音は21kHzに、22.05kHzの音は20.05kHzへと化ける。ただ、午後のこ~だの設定画面を見ても、ローパスフィルタの設定といったものは見当たらない。プリエンファシスというものはあるが、ちょっと目的が違いそうである。エンコードクオリティー設定で、高音質にすることである程度解決するのかもしれないと試してみたが、これも関係ないようだった。

 以上のことから、些細なことかもしれないが、午後のこ~だの192kbpsの使用は望ましくないという結論にいたった。一般にLAME系の音は非常にいいとされているが、多少バグなどがあるのかもしれない。実際128kbpsで使っている限りは、MP3では一番いいような気がしていたが、ビットレートの設定によっては問題が生じるようだ。



■ 原音を補正すれば再現性は向上する

同じFraunhofer-IISのエンジンを使っているSound Forgeのエンコーダで実験
 では、同じ実験をFraunhofer-IISのエンジンを使って行なったらどうなるのだろうか?前回はWindows Media Player 10のMP3エンジンで行ったが、このWMP10はCDからのエンコードはできてもWAVファイルからの直接エンコードができないため、いったんCDに焼かないとエンコードができないという面倒なソフトだ。

 これでは、やっていられないので、エンコード結果は少し異なるが、同じFraunhofer-IISのエンジンを使っているSound Forgeのエンコーダで実験を進めた。以下が128kbps、192kbps、256kbpsの結果だ。


128kbps 192kbps 256kbps

 見ればわかるとおり、こちらのエンコーダを使うと、192kbpsでも22.05kHzまでまったく減衰せずに音が出ている。もちろん、エイリアス現象なども起こしていないので、この点を見る限りではGOGOエンジンよりトラブルは少なそうだ。というわけで、ここからは主に、このSound Forge搭載のエンジンを用いて実験を進めていく。

 その実験というのは、スウィープ信号のような単純な信号ではなく、もう少し楽曲に近いもので、高域が出るかという実験だ。よくホワイトノイズなどを利用して計測する事例を見るが、そもそもMP3などのオーディオ圧縮は全部の音を出すのを目的としておらず、目立つ音だけを出し、目立たない音を消してしまうマスキングという手法を用いているから、ノイズは素材としてはよろしくない。そこで、試してみようと思ったのが楽曲の高域だけを切り取った音を通し、どれだけの再現性があるかという実験だ。

 要するにイコライザを用いて、高域だけを切り出した音をMP3にエンコードしようというわけだ。イメージ的には15~17kHz以上の音の成分だけを切り出して素材を作ろうと思っていたが、やはりそういうわけにはいかなかった。

Sonitus Equalizer

 EQを利用して処理するから当然といえば当然ではあるが、EQとはあくまでも特定の周波数を強めたり弱めたりするものであり、完全にカットするタイプのものではないためだ。そうはいっても何とかそれに近いものをということで、いくつかのEQを試してみた。

 そんな中で、Cakewalk SONARにバンドルされているSonitus EqualizerというパラメトリックEQが、ハイパスフィルターのモードを搭載しているなど、比較的使いやすいものだったので、これを利用して素材作りをした。その結果をオリジナルと比較しながら周波数成分で表したものが以下のグラフだ。


オリジナル Sonitus Equalizerで作った素材

 見た目上、処理したものもかなり中低域が出ているが、実際に聞いてみると、本当にカサカサした高域だけの音に聞こえる。ちなみに、こうした成分がよく言うところの「空気感」を作り出している。

 これをさっそくFraunhofer-IISのエンコーダを使って、エンコード。先ほどと同様に128kbps、192kbps、256kbpsのそれぞれで行ない、やはり同じくグラフ表示した。


128kbps 192kbps 256kbps

 明らかに128kbpsは16kHzが限界となっているのに対し、192kbpsおよび256kbpsは、非圧縮のものとほぼ同じような波形となっている。レベルが小さいし、非常に聞きなれない高域だけの音なので、聴感上の評価はしがたいが、なんとなく聞いた感じでは、差がないように思える。

 この第2回目の実験としての結論は、128kbpsには明らかに16kHzの壁があり、それより高い音域は出ないのに対し、192kbpsや256kbpsではそこをカバーするポテンシャルを持っているということ。第1回目の実験からも高域が出ることは見えていたが、普通のエンコードをしただけでは、きちんとした音が出なかった。しかし今回のようにEQを利用するなど、原音を補正することで再現性が高まるのだ。

 つまり、いったんCDの音をリマスタリングしてから192kbpsや256kbpsへエンコードすれば、よりCDに近い音へエンコードできるのではないか、という可能性が見えてきた。そこで、次回からは、どうリマスタリングするのがいいのかについて考察していく。

□アップルコンピュータのホームページ
http://www.apple.com/jp/
□「午後のこ~だ」ダウンロードページ
http://www.marinecat.net/free/windows/mct_free.htm
□関連記事
【7月11日】【DAL】第198回:iPodに最適なMP3を作る その1
~ MP3エンコーダにまつわる噂を検証 ~
http://av.watch.impress.co.jp/docs/20050711/dal198.htm
【2003年11月10日】【DAL】第121回:ポータブルHDDオーディオの音質をチェックする
~ その3:iPodとiTunesの音質を検証 ~
http://av.watch.impress.co.jp/docs/20031110/dal121.htm
【2002年4月8日】【DAL】第50回:圧縮音楽フォーマットを比較する
~ その9:「午後のこ~だ」の最新版を試す ~
http://av.watch.impress.co.jp/docs/20020408/dal50.htm

(2005年8月1日)


= 藤本健 = リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。
最近の著書に「ザ・ベスト・リファレンスブック Cubase SX/SL 2.X」(リットーミュージック)、「音楽・映像デジタル化Professionalテクニック 」(インプレス)、「サウンド圧縮テクニカルガイド 」(BNN新社)などがある。また、All About JapanのDTM・デジタルレコーディング担当ガイドも勤めている。

[Text by 藤本健]


00
00  AV Watchホームページ  00
00

AV Watch編集部av-watch@impress.co.jp
Copyright (c) 2005 Impress Corporation, an Impress Group company. All rights reserved.