~ その1: タイムストレッチやピッチシフトの検証方法 ~
筆者がデジタルのオーディオデータを扱うようになって、もう何年にもなるが、今までなんとなく疑問を持ちつつも、きちんと検証しないできたことがあった。それは波形編集ソフトの性能である。もう少し具体的にいうと、波形ソフトごとのサンプリングレートコンバートの正確さや、タイムストレッチ、ピッチシフトの性能である。
一般的に考えると、サンプリングレートコンバートなど、どのソフトで行なっても同じ結果になりそうなものだが、音が違うという人もいる。またタイムストレッチやピッチシフトに至っては、明らかにソフトによって音が変わり、まともに使えないソフトも少なくない。
そこで、今回から数回に渡り、波形編集ソフトおよびそれに類するソフトにおける、そういった面での性能を比較する。今回は、実際に比較するにあたって、どのような手法でテストし、どのような点を確認するのかを考えてみた。
今や、波形編集ソフトというのも珍しくなくなった。フリーウェアやシェアウェアでもかなりいいソフトがあるし、サウンドカードやCD-Rライティングソフトにバンドルされていることも少なくない。また、CubaseやLogic、SONARといったHDDレコーディングソフトの一機能として波形編集機能が備わっており、コンピュータで音楽を扱う人の多くが何らかの形で触れている。
筆者自身も、6、7年前にSonic FoundryのSound Forgeというソフトを購入して以来、Sound Forgeを中心にいろいろなソフトを使ってきた。その用途はいろいろだが、これをマスタリング用に用いてCDを作成したこともあるし、マスタリングというほどではないが、ミュージシャン側が用意してきた48kHzのDATをそのままCD化するのに、Sound Forgeを使ったこともよくある。
当初行なっていた作業はとても単純なものだった。まずS/PDIFを通じてSound Forgeでデータを吸い上げ、頭と最後の空白部分の処理を行なう。その後ノーマライズをかけて音量を整えた後、44.1kHzへサンプリングレートコンバートするというものだ。もちろん、最近は48kHz/24bitのデータをCD-ROMでもらい、それを処理するケースが増えているが、ついこの前まではこうしたDATでの受け取りが多かったように思う。まあ、本来であれば、ここにマスタリングエンジニアがついて、実際に受け取った音をじっくりと加工するわけだが……。
ただ、ここで気になっていたのが48kHzから44.1kHzへのリサンプリングという作業。そもそも48kHzでもらい、それを44.1kHzへコンバートするのがいいのか、元々44.1kHzでレコーディングしてもらったほうがいいのかというのが1つ。そして48kHzで受け取った場合、どの時点でリサンプリングするのがいいのか、つまりすぐに44.1kHzにすべきなのか、最後まで編集作業が終わってからリサンプリングすべきなのかということ。
後者については、やはり44.1kHzよりいい音だということで48kHzのデータをもらっているのだから、最後の最後まで48kHzで加工し、最終段階で44.1kHzにするのがいいだろうと考えていた。しかし、この時点で音質劣化が起きるのではないか? という疑問はずっと持ち続けていた。
一方、同様の疑問として24bitから16bitへの変換というものもある。ただし、これは明らかに音質的に差があり、上位互換性があるので24bitでもらい、最後の最後まで24bitで処理するのが正解。また、この24bitから16bitへの変換はソフトによって音質に差が出ることは広く知られている。一般的には下位8ビットを切り捨ててしまうだけだが、ディザリングという滑らかにする機能を施すことにより、音質が大きく向上する。そうしたディザリング機能を持った製品としてApogeeのUV22というものがあり、いまやこれが業界標準となっているほどだ。
もう1つ波形編集ソフトの性能として気になっているのが、タイムストレッチとピッチシフトの性能。タイムストレッチというのは、音程や音質を変えずに音の長さを変化させるという機能。最近ではビデオや、DVDでの高速再生時に音程を変えない機能として盛り込まれているので、知っている人も多いだろう。反対にピッチシフトとは音の長さを固定したまま音程を変えるというもの。これは、テレビで顔にモザイクを入れた人の声が妙に高くしてあったり、低くしてあったりする際に使われている機能に近い。
このタイムストレッチやピッチシフトを使っていて、どうも音がおかしく感じることがある。10%程度いじる分には、ほとんど感じにないが、長さを倍にしたり、音程を1オクターブ近く上げたりすると、明らかに変な音だと感じることがある。それがソフトによって、より強く感じたり、あまり違和感を感じないこともあり、性能に違いがあるようなのだ。
これまで、こうした問題について、なんとなく気にしつつも実際にチェックしたことがなかったので、この際試してみることにしよう。ただ、問題はそのチェックの仕方である。何人かの人と相談しながら実験方法を考えたのだが、基本は波形そのものを比較することだろうということになった。実際には、サイン波とか矩形波といった単純な波形を処理した後、どんな波形に変化するかを見てみた。
とりあえず用意したのは、MP3のエンコードなどでも用いていた1kHzのサイン波で-6dBの音量に設定したもの。これがどう変わるかは1つの参考になるだろう。
とはいえ、サイン波というあまりにも単純な波形では、実際の音楽とは大きく異なる。そのため、もう少し複雑化した波形も用意することにした。具体的にいうと、FM音源を用いて作り出した音だ。最初は2つのオペレータを掛け合わせた波形を作ってみたが、どうも複雑すぎて検証が難しかったので、2つのオペレータを足し合わせたものにした。それは440Hzのサイン波-8dBに330Hzの矩形波-6dBを足したものである。これならば、ちょっと複雑な波形が110Hzの周期的に繰り返されるので、どう変化するかを見るのには良さそうである。
【サイン波】 約376KB(sample1.wav) |
【サイン波+矩形波】 約376KB(sample2.wav) |
また必要あれば、これらをスペクトラムアナライザにかけて、どんな形になるかも見てみたいところだ。実際の波形とスペクトラムアナライザでの分析を見ることで、かなりの検証ができそうだ。
ただ、いくら複雑化したとはいえ、現実の音楽とはかけ離れた音であることは確か。やはり、もう少し本物に近い音楽でどうなるかも見てみたいところ。そこで、フリー素材集から取ってきた短いシンセサイザサウンド(約1,953KB、sample3.wav)と、ドラム音(約977KB、sample4.wav)の2つを用意した。これらは波形で見てもわからないだろうが、スペクトラムアナライザならもしかすると、なんらかの違いは見えるかもしれない。
サイン波+矩形波をMP3エンコード |
これらの素材で、どこまで違いが見れるか、これからいろいろとチェックしていきたいと思う。
試しに、これまでスペクトラムアナライザのみで比較していたMP3などのオーディオ圧縮だが、先ほどの合成波形を用いて、その変化を見てみた。かなり違うのに驚いたが、いかがだろうか? これはFraunhofer IISのエンコーダで128kbpsにした結果である。
なお、波形を見るソフトは何を使ってもいいのだが、ここではSound Forgeの最新版でありSound Forge 6.0を用いている。またスペクトラムアナライザに関しては、これまでと同様efu氏のWave Spectraを用いていくことにする。では、次回以降から、実際のソフト使用して検証していく。
□関連記事
【7月1日】【DAL】第60回 3D編集機能を備えた波形編集ソフト
~ 3D Sound Pro ~
http://av.watch.impress.co.jp/docs/20020701/dal60.htm
【4月15日】【DAL】第51回 Cubase VSTとの互換性を確保
~ 最新版「Cubasis VST 3.0」と次世代Cubase ~
http://av.watch.impress.co.jp/docs/20020415/dal51.htm
(2002年8月12日)
[Text by 藤本健]
= 藤本健 = | ライター兼エディター。某大手出版社に勤務しつつ、MIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。最近の著書に「ザ・ベスト・リファレンスブック Cubase VST for Windows」、「サウンドブラスターLive!音楽的活用マニュアル」(いずれもリットーミュージック)などがある。また、All About JapanのDTM・デジタルレコーディング担当ガイドも勤めている。 |
00 | ||
00 | AV Watchホームページ | 00 |
00 |
ウォッチ編集部内AV Watch担当 av-watch@impress.co.jp