【バックナンバーインデックス】


第48回:圧縮音楽フォーマットを比較する
~ その7:可逆圧縮フォーマットと、これまでのまとめ ~



 先週は、エイベックスのコピーコントロールCDを取り上げた特別編となってしまったため、1週間中断した形になってしまったが、今回は再びオーディオ圧縮の話題に戻す。しかし、これまでで一通りのフォーマットの検証は終えたので、今回は改めてそれぞれを振り返るとともに、可逆圧縮についても紹介する。


 ご存知のとおりMP3、そしてATRAC3、WMA、AAC、TwinVQ、OggVorbis……といずれも非可逆圧縮といわれるタイプのオーディオ圧縮方式である。非可逆圧縮とは読んで字のごとく、もとに戻せない圧縮のことである。一般に用いる圧縮ツールであるLHaやZIPなどは、可逆圧縮であり、一度圧縮したものを、完全な形で元に戻せるというのが前提だ。

 それに対して非可逆圧縮では、完全な形では元に戻せない。つまりオリジナルのデータであるWAVファイルを一旦MP3とかWMAにすると、ファイルサイズは1/10以下にはなるのだが、それを再度WAVに変換したとき、元のデータとは一致しない。プログラムなどの場合、圧縮したものが元に戻らなかったら何の意味ももたないが、オーディオの場合、完全に元に戻らなくても十分な意味を持つ。圧縮されたデータを再生して、人間が聞ければいいわけだ。

 ただし、そのクォリティーはオーディオ圧縮のフォーマットやその設定によってずいぶんと変わってくる。後で、これまでに試したものの一覧を並べ、比較してみたいと思うが、中にはちょっとでも音質が劣化したり、データが変化することを嫌う人もいるだろう。

 たとえば、音楽制作の現場などでは、圧縮による音質劣化を極端に嫌うケースも多く、圧縮が絡む機材は一切使わないという人もいる。とはいえ、今はネットワークの時代。音楽制作だって、ネットでやりとりして作ることも少なくない。いくらブロードバンド時代になったとはいえ、生のデータをそのまま送るのは、データ量が大きく効率的とはいえない。だからといって、LHaやZIPを用いてWAVファイルやAIFFファイルなどを圧縮しても10%も縮まらず、圧縮時間や展開時間を考えると、より非効率的ということになってしまうだろう。

 そこで登場してくるのがオーディオデータ専用の可逆圧縮技術である。現在、いくつか存在しているようだが、今回入手して、試すことができたのは、Matthew T. Ashland氏が開発したフリーウェア「Monkey's Audio」、Sonic Foundryが開発した「Perfect Clarity Audio」の2つ。


■ Monkey's Audio

 Monkey's Audioをダウンロードして起動してみると、ちょっとカワイイ感じの画面が現れる。このユーザーインターフェイスが示すとおり、使い方は至って簡単。ここにWAVファイルをドラッグ&ドロップで持ってきて、Compressボタンを押せばOK、すぐに変換がはじまる。

 このコーナーで、毎回扱っている45秒の音楽ファイルである夜間飛行.wavと10秒間の1kHzのサイン波である1kHz.wav、それに2分間のスイープ信号であるsweep.wavを圧縮したところ、たった3秒ほどで圧縮が完了した。

Monkey's Audio 圧縮中 完了

 この結果を見ると、夜間飛行.wav(2byte文字に対応していないので文字化けしてしまっているが)が60.50%に、sweep.wavが17.22%に、さらに1kHz.wavは15.53%と非常にコンパクトになっていることがわかる。

 単純なデータであるsweep.wavや、1kHz.wavが小さくなったのはともかくとして、普通の音楽データである夜間飛行.wavが60.50%にまで縮まったのは、なかなかすごい。圧縮した後のファイルの拡張子は.ape。これは、再度Monkey's Audioを用いて展開(=Decompress)することで、wavファイルに戻せるほか、MP3などと同様に、圧縮したまま再生することもできる。

 Monkey's Audioに付属のプレーヤーはもちろん、WinAmpのプラグインもいっしょにインストールされるため、WinAmpでも再生できるのが大きな特徴である。ただ、WinAmpではうまく再生できたものの、なぜか手元の環境ではMonkey's Audioに付属のプレーヤーに.apeを読み込んだだけでエラーが発生し、再生することができなかった。

Decompressすることで、wavファイルに戻せる 付属のプレーヤー WinAmp

 ちなみに実際のサイズでは7,938,184バイトのファイルが、4,802,488バイトへと圧縮されていた。MP3などと比較すればずいぶん大きなデータだが、可逆圧縮でここまで小さくなるのは優秀といえるだろう。

 念のため、一度DecompressしたデータとオリジナルデータをWaveCompareを用いて、比較した結果、1ビットたりとも狂いはなく一致した。

圧縮はFast、Normal、High、Extra Highの4種類

 その後、設定画面を調べてみると、圧縮にはFast、Normal、High、Extra Highの4種類があり、デフォルトがNormalとなっていることに気づいた。せっかくなのでExtra Highに設定した上で、再度同じことを試した見たところ、圧縮時間は約2倍の7秒ほどがかかったが、圧縮率はさらに高い58.31%となった。


■ Perfect Clarity Audio

 一方、Sonic FoundryのPerfect Clarity Audioは2000年11月に発表されたものだが、特に専用のツールが存在するわけではない。実は、可逆圧縮にどんなものがあるかを調べるまで、このPerfect Clarity Audioについて知らなかった。しかし、私自身がSonic Foundry製品の愛用者なので、手持ちの波形エディットソフトであるSound Forge 5.0をチェックしてみたら、ここに組み込まれていることに気づいた。

 Sound Forge 5.0はさまざまなデータ形式に対応したソフトなのだが、単純にWAVファイルを読み込み、別ファイルに保存しなおす際に、Perfect Clarity Audioとして保存すればいい。Custum Settingというボタンを押すと、設定画面が出てきたが、ここで設定できるのはサンプリングレートとサンプリングビットおよび、ステレオかモノラルかというだけなので、特に変更するものはなかった。

Sound Forge 5.0 ファイルの種類を「Perfect Clarity Audio」として保存する

 気になる圧縮結果だが、夜間飛行.wavが4,850,018バイト、sweep.wavが3,992,952バイト、1kHz.wavが204,912バイトという結果となった。これを見る限り、Monkey's AudioのExtra Highのほうが効率がいいし、圧縮したデータをそのまま再生できるという点でも有利だ。それぞれの結果をまとめたのが以下の表になる。


夜間飛行.wav
バイト(圧縮率)
Sweep.wav
バイト(圧縮率)
1kHz.wav
バイト(圧縮率)
Original Data7,938,18421,168,0441,764,044
Monkey's AudioNormal mode4,802,488(60.50%)3,645,131(17.22%)273,892(15.52%)
Extra High mode4,629,015(58.31%)3,404,388(16.08%)265,930(15.08%)
Perfect Clarity Audio4,850,018(61.10%)3,992,952(18.86%)204,912(11.62%)


■ まとめ

 以上、やや番外編的ではあったが、可逆圧縮に関して見てみた。さて、ここで改めて、これまでチェックしてきた非可逆圧縮について振り返ってみよう。

 MP3およびMP3 PROについては、今回のシリーズの前にチェックしていたが、これらを加えると、これまでに見てきたフォーマットはMP3、MP3 PRO、ATRAC3、Windows Media Audio、AAC、TwinVQ、Real Audio、Ogg Vorbis、QDXの計9種類。それぞれビットレートの違いや各種パラメータの違い、さらにはエンコーダの違いによって差が出てくるので、一列に比較するのはなかなか難しいところではある。

 しかし、あえて、それぞれの代表的な設定を1つずつピックアップし、その周波数特性をグラフで表したものを並べてみた。

【オリジナルデータ】

【MP3 128kbps】
ジャストシステム MP3 BeatJam XX-TREAM(高速モード)
【MP3 PRO 96kbps】
ahead software nero5.5 特別限定版(速いモード)
【ATRAC3 132kbps】
ソニー OpenMG Jukebox

【Windows Media Audio 8 128kbps】
マイクロソフト Windows Media Player 7.1
【AAC 128kbps】
松下電器 SD-Jukebox Ver2.3
【TwinVQ 96kbps】
ヤマハ SoundVQ Encoder(Normalモード)

【RealAudio 8 with ATRAC3 132kbps】
RealNetworks RealJukebox PLUS
【Ogg Vorbis 128kbps】
CD-DA X-Tractor
【QDX 128kbps】
QDesign MVP

 もちろん、このグラフだけですべてを比較できるものではないし、そもそも何をどのように比較するかによって見方も変わってくる。その比較方法としては、大きく2種類があると思う。1つは、同じ音質でどれだけコンパクトにできるかというもの。つまり、高音質というところは多少目をつぶり、そこそこの音質を64kbpsで実現できたとか、32kbpsで実現できたといった比較をする方法。そしてもう1つは、一般的なビットレートでどれだけ高い音質を実現できるかというものだ。

 これまで特に明示してこなかったが、このDigital Audio Laboratoryでは後者の方法を主眼に置いてきた。つまりMP3で標準とされている128kbpsの近辺のビットレートでどれだけ原音に近い高音質を実現できるかという視点での比較である。なおATRAC3では128kbpsという設定がないため132kbps、MP3 PROやTwinVQでは96kbpsまでしかサポートしていないため96kbpsを用いている。

 こうして考えたとき、どこまで高域が出ているのかというのは1つの参考になるだろう。たとえばMP3は16kHzまでしかでていないし、WMA8やAACも16kHzか17kHz以上はまともに出ていない。RealAudioはもう少し上まで出ているがやはり18kHzくらいが限界となっていることがわかる。実際に音を聞いてみると、これら高域が切れているものは、どうしても微妙な部分での音の変化が気になってしまう。

 では、高域さえ出ていればOKなのかというと、そうでもない。実際MP3でもエンコーダを変えると、もっと高域まで出ているものもあるのだが、それで画期的に音質向上があるわけでもないのだ。たとえばTwinVQなどは96kbpsという低ビットレートながら、22.05kHzまで音がしっかり出ていることがグラフからわかる。ところが聞いてみると、それなりの音質であり、MP3と同等程度。それに対し、同じ96kbpsでもMP3 PROのほうは、かなり高音質だ。MP3の128kbpsよりも上といって間違いないだろう。MP3 PROの128kbpsの音というのを聞いてみたかったが、現時点でのエンコーダにはこの設定がないのがちょっと残念であった。

 一方、雑誌などで高音質になったと評判のWindowsMediaAudio 8はちょっと期待ハズレだった。前のバージョンでのエンコード結果とも比較してみたが、128kbpsにおいてはほとんど違いはなかった。おそらくマイクロソフトの視点は高音質を求めるというよりも、いかに低ビットレートでそこそこの音を出すかということにあったのだろう。32kbps近辺でエンコードすると、従来のバージョンやほかのフォーマットでの結果と比較していい音なのだろうが、今回はオーディオとして聞くことを前提での比較であったため無視した。

 こうして、いろいろと見てきた中で、もっともいい音だったのがソニーのATRAC3だ。ご存知のようにATRAC3はレコード会社の音楽配信で用いられたり、ネットワークウォークマンなどのポータブルプレーヤーでも使われているフォーマット。そして、Net MDや、MDLPで採用されている。

 132kbpsのATRAC3はMDLP2に相当するものなのだが、逆の見方をすればMP3もAACもTwinVQもみんなMDLP2以下の音質であるといえるかもしれない。MDLP対応のデッキに搭載されているエンコーダにもいくつかの種類があれば、機種によって音質の違いというのも出てくるだろう。実際MDが採用しているATRACにも世代があり、製品によってずいぶんと音質も違っている。比較的古めのMDであれば、現在のMDLP2のほうが音質が上だったりする。

 こうしたデッキの音質についてはともかく、PCでエンコード、デコードできるオーディオ圧縮フォーマットとしては現時点ATRAC3の132kbpsがベストであるというのが私の結論である。ただし、OpenMG Jukeboxを用いて利用するATRAC3のファイルは著作権管理が厳しくなっているため、自由度が効かないことも確かだ。不法コピーを蔓延させることも問題だが、ここまで自由度がないのも使いづらい。今後、ATRAC3をサポートするツール類が増えてくれば、もう少しは使いやすくなるのかもしれないので、それに期待したいところである。

 また、今後新しいフォーマットや新バージョンのエンコーダーなどが登場したら、随時チェックしていきたい。

(C)TINGARA
「夜間飛行」(作詞:名嘉睦稔 作曲:名嘉睦稔、TINGARA)
□TINGARAのホームページ
http://www.tingara.com/

□Monkey's Audioのホームページ(英文)
http://www.monkeysaudio.com/
□Sonic Foundryのホームページ(英文)
http://www.sonicfoundry.com/

(2002年3月25日)

[Text by 藤本健]


= 藤本健 = ライター兼エディター。某大手出版社に勤務しつつ、MIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。最近の著書に「ザ・ベスト・リファレンスブック Cubase VST for Windows」、「サウンドブラスターLive!音楽的活用マニュアル」(いずれもリットーミュージック)などがある。また、All About JapanのDTM・デジタルレコーディング担当ガイドも勤めている。


00
00  AV Watchホームページ  00
00

ウォッチ編集部内AV Watch担当 av-watch@impress.co.jp

Copyright (c) 2002 impress corporation All rights reserved.