第498回:【続】「Mastered for iTunes」の音の良さとは?

~iTunes変換と同じ? ダイナミックレンジの差も検証 ~


Mastered for iTunes

 先週、アップルのMastered for iTunesに関する検証を行なった。サンプリングレートだけでいうと従来どおりCDからエンコードしても24bit/96kHzをマスターにして行なっても大差ないというのが結論だった。やや検証結果に物足りなさも残る内容だったが、かなり多くの方から反響をいただいた。

 特にプロのミュージシャンやマスタリングエンジニアなどからも、Twitter経由でコメントをいただいていたのだが、その中で1つ「え??」と思わされたものがあった。ミュージシャンでプロデューサーの戸田誠司さんからのコメントだ。要約すると「Mastered for iTunes Dropletは以前からあるコマンドラインのツール、afconvertでの変換を自動で行なうものに過ぎず、それはiTunesの機能と同等である。今回、afconvertはバージョンアップしていないので、それほど騒ぐ話ではないよ」というものだった。

 偶然ではあるが、先週あるライブハウスで戸田さんとお会いしたので、話をしたところ、「Mastered for iTunesがafconvertにスクリプトとして渡しているパラメータは特別なものではないから、比較したら同じ結果かもしれないよ」とのアドバイスをいただいた。実は、ほかにもマスタリングエンジニアの方から、16bit/44.1kHzのデータではあるが、iTunesで変換したのとMastered for iTunesで変換したものは、バイナリーで一致した、という報告をいただいた。

 でも、アップルがあれだけ大々的に発表を行ない、ロゴまで作り、専用のダウンロードサイトまで作って宣伝しているのだから、従来からのiTunesでの変換と何も変わらないというのは、俄かには信じられない。逆にいうと、前回記事を作った際は、当然変わっていることを前提に実験をしていたので、同じデータをiTunesでエンコードしたものの周波数分析はしたが、バイナリの比較まではしていなかった。そこで、今回は、まず戸田さんやそのマスタリングエンジニアが言っていることが本当であるかを検証したい。その上で、前回やり残した、アップルのいう「24bitのデータをエンコードしたほうがいい結果になる」が本当なのかも検証してみることにしよう。



■ 「Mastered for iTunes」はiTunesエンコードと同じ?

 今回検証するにあたって、まず準備したのが24bit/96kHzのデータだ。単にMastered for iTunes DropletとiTunesでの結果の比較だけであれば、どんなデータでもよかったのだが、せっかくなら16bitと24bitのダイナミックレンジの違いを実感できる内容にしたいところ。

 Twitter上で相談してみたところ、何人かの方から、「シンバルなど楽器の減衰音を録音するといい」というアドバイスをいただいた。確かに、音が消え入るところを捉えれば、違いが出そうだ。

 ただ、手元にあるシンバルは電子ドラムのものなので、あまり適当ではない。そこで、ローランドのリニアPCMレコーダ、R-05を使い、アコースティックピアノの音を録音してみた。もちろん、24bit/96kHzの設定で行ない、中央ドの音を押したまま30秒弱。耳で聴く限りは15秒くらいでほぼ音が出なくなっていたが、さらに引っ張ってみたのだ。実際の音がこれだ。

音声サンプル
piano.wav(17.8MB)
アコースティックピアノの音を、R-05の24bit/96kHzで録音
編集部注:編集部では再生環境についての個別のご質問には
お答えいたしかねますのでご了承下さい。
Mastered for iTunes Dropletでエンコード

 このWAVファイルをMacのLionにコピーした上で、先週と同様に、Mastered for iTunes Dropletでエンコードしてみた。またMacのiTunesを最新版の10.6(40)にアップデートした上で、AACエンコードの設定を確認すると、デフォルトでiTunes Plus、つまりAACの256kbpsとなっていた。この設定のまま何もいじらずにpiano.wavをAACにエンコードしてみた。


最新のiTunesで、エンコーダはAACの256kbps先ほどのpiano.wavをAACに変換
afconvertのタイムスタンプは、新しくはなっていないようだ

 さらにもうひとつ行なったのはafconvertを使ってのエンコードだ。その前に本当にこれが新バージョンになっていないのか、ファイルのタイムスタンプを確認したところ、2011年8月2日。確かに、最近更新されたものではなさそうだ。さらに、アップルのマニュアルにしたがってエンコードを行なってみた。前回の記事でも触れたとおり、一度中間ファイルを生成してからAACに変換するのだが、具体的にはターミナルを開いた上で、コマンドラインで


    afconvert piano.wav -d LEF32@44100 -f caff --src-complexity bats -r 127 intermediate.caf

 

と実行するとintermediate.cafという中間ファイルが生成される。普段UNIXやLinuxなど使うことがないので、ちょっと緊張するが、とくに問題なく動作してくれた。さらに、


    afconvert intermediate.caf -d aac -f m4af -u pgcm 2 -b 256000 -q 127 -s 2 piano_afconvert.m4a

 

と実行することで、piano_afconvert.m4aというファイルが得られる。以上で3つのAACファイルが生成されたわけだが、さらにWindows版のiTunesでもエンコードを行なってみた。こちらも10.6.0.40で64bit版である。

piano_afconvert.m4aというファイルが作られたWindows版のiTunesでもエンコードした

 ただ、これをWAVに変換しないと比較しにくいので、これもMac上のafconvertで変換してみた。こちらは、


    afconvert piano.m4a piano_afconvert.wav -d LEI24 -f WAVE

 

とすることで、piano_afconvert.wavというファイルが24bit/44.1kHzにて生成される。ほかの3つのファイルも同様にしてWAVに変換してみた。さらに、それをWindowsへとコピーし、efu氏のフリーウェア、WaveCompareを用いて、バイナリ比較を行なってみた。その結果、Mastered for iTunesでエンコードしたものとiTunesでエンコードしたものは、ビットパーフェクトで一致。さらにiTunesでエンコードしたものとafconvertで変換したものも一致。ここで、前回、自分がアップルの宣伝に踊らされていたことが判明してしまった。ただしWindows版でエンコードしたものだけは、やはりWindowsとMacのプログラムに違いがあるのか、完全には一致しなかった。

Mastered for iTunesでエンコードしたものとiTunesでエンコードしたものが一致iTunesでエンコードしたものとafconvertで変換したものも同じ結果にWindows版とMac版では完全には一致しなかった


■ 余韻部分に違いが出るかを実験

 さて、次に見てみたのは先ほどのピアノの余韻部分が、どう変化するかだ。前述のとおり24bit/96kHzでレコーディングしているので、これをリニアPCMで16bit/44.1kHzに変換すると、サンプリングレートの影響で周波数帯域が縮まり、量子化ビット数の影響でダイナミックレンジが縮まる。実際にSound Forgeに搭載されているiZotopeのコンバータを用いて16bit/44.1kHzに変換した結果がこのWAVファイルだ。

音声サンプル
izotope1644.wav(5.47MB)
iZotopeのコンバータで16bit/44.1kHzに変換したファイル
編集部注:編集部では再生環境についての個別のご質問には
お答えいたしかねますのでご了承下さい。

 普通に再生しただけだと、判別はしづらいが、余韻部分を増幅すると、差が歴然と出てくるだろうというのが筆者の予想。とりあえず、増幅作業は後のお楽しみとして、24bit/96kHzのデータをMastered for iTunesで変換するとともに、いま生成した16bit/44.1kHzのデータも同じように変換し、その後afconvertでWAVの24bit/44.1kHzのデータに書き戻してみた。

 このオリジナルの24bit/96kHzも含め4つのファイルをSound Forgeで波形表示させるとこのようになる。当然、この状態では差はよくわからないので、余韻部分である後半16秒分を括りだした上で、増幅してみた。当初ノーマライズをかけて、最大値を0dBにしてみたが、それだとそれぞれで増幅率が変わってしまうため、すべて同じ増幅を行なうことにした。

元の24bit/96kHzファイルiZotopeで16bit/44.1kHzに変換
Mastered for iTunesで16bit/44.1kHzに変換16bit/44.1kHzのデータを、afconvertで24bit/44.1kHzに書き戻したもの

 試行錯誤した結果、約56dB上げると見た目上ハッキリすることが分かった。その結果のグラフがこちら。また増幅した結果の音もWAVで紹介しておこう。

グラフ音声サンプル
piano_2.wav(17.8MB)
元の24bit/96kHzファイル
izotope_1644_2.wav(2.89MB)
iZotopeで16bit/44.1kHzに変換
piano_mfi_2.wav(9.45MB)
Mastered for iTunesで16bit/44.1kHzに変換
izotope_1644_mfi_2.wav(4.34MB)
16bit/44.1kHzのデータを、afconvertで
24bit/44.1kHzに書き戻したもの
編集部注:編集部では再生環境についての個別のご質問には
お答えいたしかねますのでご了承下さい。

 聴いてみると、残念ながら予想とはかなり違う状況になっていた。まあ、静かな部屋ではあったのだが、外部からの音を遮断した防音スタジオというわけではないので、後半部分は明らかにピアノ音より、外部ノイズのほうが大きい。それでも消えいくピアノの残響はハッキリと聴こえるわけだが、想像以上に16bitの性能はよかった。最後の最後までハッキリとピアノ音を聴き取ることができるのだ。

 まあ、波形を見ると振幅具合など違いはあるものの、このグラフから、明らかに意味のある違いは見受けられない。また残念ながら筆者の耳では、その差をしっかりと認識できなかった。耳のいい人なら、すぐに分かるのかもしれないが…。やはり実験方法に無理があったのかもしれない。再度、録音にトライしようかとも思ったが、改善があるとは思えず、壁にぶつかってしまった。



■ “作った音”でダイナミックレンジを比較

 ここで、もう一度基本に戻って考えてみた。先ほどの増幅率が56dBであったことを考えると、ハッキリした違いが目に見えないのは当たり前。そもそも16bitの量子化ビット数なら96dBのダイナミックレンジがあるわけで、96dB近く増幅しないことには、その差を画面に表示させるのは難しい。では、そんな絶妙な音を録音するのはどうすればいいか…と悩んだのだが、録音が難しいのなら、作ってしまえばいい、という結論に達した。つまり16bitでは表現不可能なほど小さな信号を人工的に作り出すのだ。

 Sound Forgeにも波形生成機能があるが、そんな小さな音は作れなかった。そこで、またefu氏作成のWaveGenを使ってみたら、簡単にできてしまった。ここで作ったのは24bit/96kHzのフォーマットで1kHz、-100dBの三角波。このままでは当然、画面では確認できないので、0dBのノーマライズ処理を行なったのがこれだ。

WaveGenで極小の信号を作成24bit/96kHzで、1kHz、-100dBの三角波を0dBにノーマライズ処理したもの

 試しに、先ほどのiZotopeのコンバータで16bit/44.1kHzに変換した後にノーマライズすると、もうデタラメなノイズになっている。信号ゼロの状態でなく、このようなノイズになったのは、iZotopeでの16bit変換においてディザリングノイズを追加したためではないかと思う。

 次に、この24bit/96kHzの三角波をAACに変換し、再度WAVに戻したものをSound Forgeで表示させみた。どうだろう、確実に波形が刻まれていることが分かる。少し波形がゆがんでいるのが、44.1kHzへの変換およびAACのエンコードによる劣化ということなのだろう。

iZotopeのコンバータで16bit/44.1kHzに変換した後にノーマライズすると全く違うノイズに24bit/96kHzの三角波をAACに変換し、再度WAVに戻したものをSound Forgeで表示

 ここから分かるのは、iTunes Plus、つまりAACの256kbpsのダイナミックレンジは広く、
特定の条件下であれば、24bit相当とまでいかなくてもCDを超える性能を持っているということだ。周波数特性は22kHzあたりまでしか表現できないが、ダイナミックレンジにおいてはCDの性能を遥かに超えているというのが結論だ。もちろん、これは実験用の単純な信号を使っての結論なので、これを持ってiTunes Plusのほうが音がいいということにはならないが……。

 とくにたくさんの音が重なっているときの小さな音は、AACエンコードにおけるマスキング処理によって消されてしまう可能性があるため、分解能としての24bitがどこまで表現できるかは疑問は残るところだが、それでもある程度の性能は期待できそうである。

 少なくても、Mastered for iTunes(iTunesで行なっても同じだが)でAACにエンコードするのならCDを使うより、24bitデータを使ったほうが音質向上が見込めるのは確実のようだ。



■ 今後の配信向けマスターが変わる?

 今回の実験からの結論をまとめると、

  • Mastered for iTunesはiTunesエンコードと同じ
  • AACエンコードについては、24bitデータを使ったほうが、CDからのエンコードよりは音質向上が見込める

ということが分かった。

 最後に改めてアップルの今回の発表について考えてみた。これは別にMastered for iTunes Dropletが完成したことを自慢しているのではなく、24bitのマスターを元にエンコードしたデータが揃ったのでCDからエンコードしたものとは違うぞ、ということを宣伝したかった、と考えれば腑に落ちる。今後、こうしたデータは増えていくのだろう。

 ただ、これまでのところ、国内の楽曲をiTunes Storeへ納品する際は、エンコードしたデータではなく、CDを渡すのが基本となっていた。そのため、このままではMastered for iTunesの恩恵を得られない。DDP(Disc Description Protocol)でのデータ納品など24bitデータでの受け渡しが可能になってくると、iTunes Storeでの音質面で大きな向上が期待できそうだ。もちろん、それに伴ってマスタリングエンジニアの仕事の仕方や、納品物も変わってくるので、簡単ではないかもしれない。


(2012年 3月 12日)

= 藤本健 = リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。
 著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。Twitterは@kenfujimoto

[Text by藤本健]