~ 128kbpsでは表現しきれない「16kHzの壁」 ~ |
128kbps | 192kbps | 256kbps |
これを見ると、128kbpsでは明らかに15.5kHz以上の音は出ていない。マスキング効果によって、目立たない音を消してファイル容量を圧縮するというMP3ではあるが、単純にサイン波だけであっても高域においてはバッサリと消し去られてしまうようなのだ。それに対し、192kbpsでは20kHz程度まで出るようになり、256kbpsなら22.05kHzまで切れずにしっかり出る。ということは、うまく使えばもっと高域まで音が出せる可能性があるというわけだ。
ただ、ここでひとつ気になったことがある。192kbpsの高域での挙動が、128kbpsの場合と何か違うのだ。これまでも似た現象を経験したことがあったのだが、このWaveSpectraの動きを見ていると、ある周波数の高さまで行ったところで、折り返して下がっていく。
SoundForgeで見ると、高域に上がっていく最後の辺りが妙な形に |
つまり本来グラフは時間が経過するに連れて、右へ右へと進んでいくはずだが、あるところから左へ進みはじめるのである。20kHzあたりで減衰しきったところからで、ちょうど反対にグラフをなぞるように進みだすのだ。
試しに、MP3データをデコードしたデータを波形編集ソフトであるSoundForgeで見ると、高域に上がっていく最後の辺りが妙な形になっていた。これはまさにエイリアス現象ではないか。つまり、ローパスフィルターを使わないで43kHzのサンプリングレートで録音した音のようになっており、21.5kHzを超える音が出ないどころか、21.5kHz以下の音に悪影響を与えてしまう。
ローパスフィルタの設定は見当たらない |
以上のことから、些細なことかもしれないが、午後のこ~だの192kbpsの使用は望ましくないという結論にいたった。一般にLAME系の音は非常にいいとされているが、多少バグなどがあるのかもしれない。実際128kbpsで使っている限りは、MP3では一番いいような気がしていたが、ビットレートの設定によっては問題が生じるようだ。
同じFraunhofer-IISのエンジンを使っているSound Forgeのエンコーダで実験 |
これでは、やっていられないので、エンコード結果は少し異なるが、同じFraunhofer-IISのエンジンを使っているSound Forgeのエンコーダで実験を進めた。以下が128kbps、192kbps、256kbpsの結果だ。
128kbps | 192kbps | 256kbps |
見ればわかるとおり、こちらのエンコーダを使うと、192kbpsでも22.05kHzまでまったく減衰せずに音が出ている。もちろん、エイリアス現象なども起こしていないので、この点を見る限りではGOGOエンジンよりトラブルは少なそうだ。というわけで、ここからは主に、このSound Forge搭載のエンジンを用いて実験を進めていく。
その実験というのは、スウィープ信号のような単純な信号ではなく、もう少し楽曲に近いもので、高域が出るかという実験だ。よくホワイトノイズなどを利用して計測する事例を見るが、そもそもMP3などのオーディオ圧縮は全部の音を出すのを目的としておらず、目立つ音だけを出し、目立たない音を消してしまうマスキングという手法を用いているから、ノイズは素材としてはよろしくない。そこで、試してみようと思ったのが楽曲の高域だけを切り取った音を通し、どれだけの再現性があるかという実験だ。
要するにイコライザを用いて、高域だけを切り出した音をMP3にエンコードしようというわけだ。イメージ的には15~17kHz以上の音の成分だけを切り出して素材を作ろうと思っていたが、やはりそういうわけにはいかなかった。
Sonitus Equalizer |
EQを利用して処理するから当然といえば当然ではあるが、EQとはあくまでも特定の周波数を強めたり弱めたりするものであり、完全にカットするタイプのものではないためだ。そうはいっても何とかそれに近いものをということで、いくつかのEQを試してみた。
そんな中で、Cakewalk SONARにバンドルされているSonitus EqualizerというパラメトリックEQが、ハイパスフィルターのモードを搭載しているなど、比較的使いやすいものだったので、これを利用して素材作りをした。その結果をオリジナルと比較しながら周波数成分で表したものが以下のグラフだ。
オリジナル | Sonitus Equalizerで作った素材 |
見た目上、処理したものもかなり中低域が出ているが、実際に聞いてみると、本当にカサカサした高域だけの音に聞こえる。ちなみに、こうした成分がよく言うところの「空気感」を作り出している。
これをさっそくFraunhofer-IISのエンコーダを使って、エンコード。先ほどと同様に128kbps、192kbps、256kbpsのそれぞれで行ない、やはり同じくグラフ表示した。
128kbps | 192kbps | 256kbps |
明らかに128kbpsは16kHzが限界となっているのに対し、192kbpsおよび256kbpsは、非圧縮のものとほぼ同じような波形となっている。レベルが小さいし、非常に聞きなれない高域だけの音なので、聴感上の評価はしがたいが、なんとなく聞いた感じでは、差がないように思える。
この第2回目の実験としての結論は、128kbpsには明らかに16kHzの壁があり、それより高い音域は出ないのに対し、192kbpsや256kbpsではそこをカバーするポテンシャルを持っているということ。第1回目の実験からも高域が出ることは見えていたが、普通のエンコードをしただけでは、きちんとした音が出なかった。しかし今回のようにEQを利用するなど、原音を補正することで再現性が高まるのだ。
つまり、いったんCDの音をリマスタリングしてから192kbpsや256kbpsへエンコードすれば、よりCDに近い音へエンコードできるのではないか、という可能性が見えてきた。そこで、次回からは、どうリマスタリングするのがいいのかについて考察していく。
□アップルコンピュータのホームページ
http://www.apple.com/jp/
□「午後のこ~だ」ダウンロードページ
http://www.marinecat.net/free/windows/mct_free.htm
□関連記事
【7月11日】【DAL】第198回:iPodに最適なMP3を作る その1
~ MP3エンコーダにまつわる噂を検証 ~
http://av.watch.impress.co.jp/docs/20050711/dal198.htm
【2003年11月10日】【DAL】第121回:ポータブルHDDオーディオの音質をチェックする
~ その3:iPodとiTunesの音質を検証 ~
http://av.watch.impress.co.jp/docs/20031110/dal121.htm
【2002年4月8日】【DAL】第50回:圧縮音楽フォーマットを比較する
~ その9:「午後のこ~だ」の最新版を試す ~
http://av.watch.impress.co.jp/docs/20020408/dal50.htm
(2005年8月1日)
= 藤本健 = | リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。 最近の著書に「ザ・ベスト・リファレンスブック Cubase SX/SL 2.X」(リットーミュージック)、「音楽・映像デジタル化Professionalテクニック 」(インプレス)、「サウンド圧縮テクニカルガイド 」(BNN新社)などがある。また、All About JapanのDTM・デジタルレコーディング担当ガイドも勤めている。 |
[Text by 藤本健]
00 | ||
00 | AV Watchホームページ | 00 |
00 |
AV Watch編集部av-watch@impress.co.jp Copyright (c) 2005 Impress Corporation, an Impress Group company. All rights reserved.