藤本健のDigital Audio Laboratory

第562回:DAWの“タイムストレッチ”で音質はどう変わる?

第562回:DAWの“タイムストレッチ”で音質はどう変わる?

「ProTools 11」と「Cubase 7」で異なる結果に

 Cubase、SONAR、ProTools、Logic、ACID、Digital Performer、StudioOne……、数多くのDAWが存在し、それぞれ競い合っている結果、いずれも機能、性能的には近いものになってきている。ただ、そうした中で、「DAWによって性能の差がある」といわれている機能のひとつに「タイムストレッチ」がある。ピッチを変えずにテンポ(時間)を変更するという機能だ。このタイムストレッチでどの程度音質が変化するのかを各DAWで試してみると、確かに違いがあることが見えてくる。そこで、これから何回かに分けて、さまざまなDAWで同じタイムストレッチを行ない、それぞれでどう音質が違うのかを見ていくことにしよう。今回は、Avidの「ProTools 11」と、Steinbergの「Cubase 7」を使用している。

ProTools 11の編集画面
Cubase 7のパッケージ

同じようで異なる各DAWのタイムストレッチ機能

 タイムストレッチ自体は、古くからあるDAWの機能の一つで今さら説明するまでもないが、音の時間を伸縮する処理機能だ。これはデジタル処理だからこそ実現できる機能であり、アナログではなかなか実現できなかった。直感的にも分かると思うが、テープの場合は回転速度を上げて時間を半分にすると音程が1オクターブ上がってしまい、反対に時間を倍にすると1オクターブ下がってしまう。そうした音程の変化をさせることなく、時間だけを変化できるのが、DAWに搭載されたタイムストレッチなのだ。

 現在あるDAWのほぼすべてにこのタイムストレッチ機能が搭載されている。しかし、このタイムストレッチのアルゴリズムはなかなか複雑なようで、各DAWによって異なるタイムストレッチエンジンが採用されており、ものによっては複数のタイムストレッチエンジンを切り替えて使えるようになっている。また、必ずしもDAWメーカーの自社開発のタイムストレッチエンジンが搭載されているわけではないようで、専業メーカーからエンジンの提供を受けているケースも多い。著名な専業メーカーとしてはドイツのZplaneがあり、同社が開発するエンジン、elastiqueは数多くのDAWに供給されている。ただ、一言でelastiqueと言っても、旧バージョンのV1と現行のV2があり、それぞれ、以下の3つのグレードがある。

  • elastique Pro
  • elastique efficient
  • elastique SOLIST

 これらのうち、どれを採用しているかによって結構違いもあるようなのだ。DAWメーカーによってはelastiqueを採用しているかどうかを明言しているところと、明らかにしていないところがある。また、elastiqueと書かれていても、どのバージョン、どのグレードなのかがわからないことも多い。すべてが網羅されているわけではないようだが、ZplaneのWebサイトを見ると、供給先とそのバージョンが記載されているので、参考にはなりそうだ。

 まあ、同じエンジンが採用されているのであれば、結果は同じであるはずなのだが、「●●●のタイムストレッチは優秀で、▲▲▲のと比較すると、断然高音質だ」といった噂や宣伝がされているのが実情。確かに同じエンジンでも実装の仕方によって違いが出てくる可能性はあるので、あまり決めつけてしまうのも危険。とういわけで、ひとつひとつ音を聴きながら、チェックしてみたいと思う。

 では、どうやって比較するといいのだろうか? タイムストレッチで音質の差が出やすいのは、音を伸長したとき。つまり、元々10秒の音を15秒、20秒と長くすると、間延びする分、どう音を補完できるかによって差が出てくるのだ。反対に時間を圧縮して身近くする場合は、間引きするからなのか、音の違いは分かりにくくなる。そこで、ここでは、いくつかの素材を元に、音を伸長して比較していく。

 タイムストレッチの主な使い方としては、尺合わせであり、3分54秒の音を、4分ちょうどにしたい、といったケースだ。こうした場合は、数%の伸縮で済むため、比較的音質に影響が出ないことが多いが、その音質の違いに神経を削る人も少なくないだろう。またボーカルのレコーディングした結果、伸ばすところが半拍短かったので、これを調整したい……なんていうケースもありそうだ。こうした場合は、数十%以上の伸縮となるため、タイムストレッチエンジンの性能が声質に大きく響いてくる。というわけで、いろいろなケースで見ていく必要がありそうだ。

 そこで用意した素材は3つ。1つ目はこの連載で以前にも使ったことのあるドラム、ベース、ギターによる24秒間のデモ。2つ目はフリーのループ素材から見つけた女性ボーカル。そして3つ目は-6dBで1kHzとして生成した矩形波。それぞれどんな結果になるかを見ていこう。

 下に掲載する元の素材はいずれも16bit/44.1kHzのWAVファイルだが、実験結果の音質の違いは、MP3でも十分わかるので、MP3/192kbpsのデータを掲載していく。

音声サンプル(オリジナルWAV)
ドラム/ベース/ギターsample.wav(4.07MB)
ボーカルvocal.wav(1.02MB)

ProTools 11の場合

 まずはProTools 11からだ。ProToolsの場合、タイムストレッチは2つの方法が用意されている。まずは編集ウィンドウで直感的に操作できるTCE(Time Compression and Expantion)を使う方法。先ほどのsample.wavをトラック上に置いて、150%と200%に引き延ばしてみた。結果を聴くと分かる通り、特に200%にした際のドラムの音がかなり妙な音に変質してしまっていることが分かるだろう。150%であれば、まだマシだが、それでもスネアの崩れ具合は許容度合を超えていると言わざるを得ない。ちなみに、この結果は、Pro Tools 11の新機能であるオフラインバウンスを用いてWAVで書き出し、その後iTunesを用いてMP3/192kbpsに変換している。

TCEを使用
sample.wavをトラック上に置く
オフラインバウンスでWAVで書き出した
音声サンプル(ドラム/ベース/ギター)
ProTools(TCE) 150%pt_150.mp3(754KB)
ProTools(TCE) 200%pt_200.mp3(1.12MB)

 では、ボーカルの場合どうなのか。同じように150%、200%にした際の結果が以下の通り。ドラムほどの崩れ具合ではないが、それでも声が結構つぶつぶに途切れてしまっている印象を受ける。

音声サンプル(ボーカル)
ProTools(TCE) 150%pt_v_150.mp3(215KB)
ProTools(TCE) 200%pt_v_200.mp3(285KB)
矩形波を伸長した時の画面

 では、これが矩形波だったらどうなのか。これについては、画面を見ると一目瞭然。ほぼ完全な状態で矩形波が描かれており、非常にキレイな状態で伸長されているのだ。矩形波については、聴いてチェックする素材ではないのでMP3は掲載しないが、単純な波形の場合は、それが保全されるということなのだろう。

 このProTools 11のタイムストレッチは、このTCEを使う方法のほかにAudioSuiteにあるTimeShiftというプラグインで行なう方法がある。ここにはモードとしてデフォルトのPolyphonicを含め4種類が用意されている。ただ試してみたところ、今回使った3つの素材いずれもPolyphonic以外いい効果が得られなかったので、これを用いて、150%、200%に変換した結果が下の通り。それぞれの音を聴いてみると、先ほどのTCEでの処理に極めて近い。マニュアルを見ても、その辺の詳細が書かれていないのでわからないが、もしかしたら、TCEでの処理とPolyphonicは同じエンジン、同じ設定なのかもしれない。

プラグインのTimeShiftを使用
Polyphonicなど4種類が用意されている
音声サンプル(ドラム/ベース/ギター)
ProTools(TimeShift/Polyphonic) 150%pt_p_150.mp3(848KB)
ProTools(TimeShift/Polyphonic) 200%pt_p_200.mp3(1.12MB)

【訂正】記事初出時、「pt_p_150.mp3」に誤ったファイルを掲載していたため、正しいものに差し替えました(8月19日19時33分)

音声サンプル(ボーカル)
ProTools(TimeShift/Polyphonic) 150%pt_p_v_150.mp3(192KB)
ProTools(TimeShift/Polyphonic) 200%pt_p_v_200.mp3(285KB)

Cubase 7の場合

 では、同じ実験をCubase 7で行なうとどうなるのだろうか? さっそく試してみた。Cubaseの場合も、タイムストレッチの方法はいくつかあるが、わかりやすいのはProToolsのAudioSuiteと同様にAudio編集処理として行なう方法。これを選択すると、タイムストレッチのダイアログが表示されるので、ここで設定を行なう。デフォルトでは、アルゴリズムが、「MPEX-Mix fast」となっており、選択可能になっているのが分かる。とりあえずはデフォルトの状態で、sample.wavとvocal.wavをそれぞれ150%、200%へと伸長してみた。これを先ほどのProTools 11の結果と聴き比べてみると差は歴然。どちらも、Cubaseのほうが、いい結果になっている。さすがに200%にすると音質の劣化は激しいが、150%で見る限り、スネアの音も断然いいし、ボーカルもずっと滑らかだ。

Audio→処理→タイムストレッチを選択
タイムストレッチの画面
デフォルトでは「MPEX-Mix fast」が選択されている
音声サンプル(ドラム/ベース/ギター)
Cubase(MPEX-Mix fast) 150%cb_mp_150.mp3(848KB)
Cubase(MPEX-Mix fast) 200%cb_mp_200.mp3(1.12MB)
音声サンプル(ボーカル)
Cubase(MPEX-Mix fast) 150%cb_mp_v_150.mp3(215KB)
Cubase(MPEX-Mix fast) 200%cb_mp_v_200.mp3(285KB)

 では、もう一つの素材である矩形波を変換するとどうなるのだろうか? まず、元の読み込んだだけの状態では、キレイな矩形波が描かれている。ところが、これをMPEXで200%に伸長してみると、ずいぶん違った結果になった。これは縮小した波形の図だが、これを見ると頭の約30msecだけ波形が小さくなっており、処理が均一化されるまで若干の時間がかかっているように見受けられる。そして、これを拡大していくと、波形の形がハッキリと見えてくるが、最初の矩形波とはまったく違う形になっているのが分かる。ProToolsで完全な形が再現されていたのとは大きな違いだ。恐らく、こちらのほうが聴いた感じの音質を再現できるような処理をしているけれど、機械的な波形は苦手ということなのではないだろうか……。

元の矩形波
200%に伸長すると、元とはハッキリ違いが出ている

 さて、このCubaseのタイムストレッチ、先ほども話題に出したZplaneのelastiqueをアルゴリズム(エンジン)として選択できるので、それを使ってみた。elastiqueといっても、よく見るといろいろな種類があるが、ここでは一番上のelastique Pro-Timeを選んで、同じように実験を行なった。その結果が以下の通り。こちらを聴いてみると、先ほどのMPEXよりもさらによくなっている。これまで聴いていたハイハットの音は、いずれも歪んだ感じにリバーブをかけたような妙な音だったが、こちらはだいぶよくなっているのだ。ボーカルもさらに、自然になっているのが分かる。ただし、矩形波を拡大してみると、やはり、妙な波形になっているようだ。

Zplaneのelastiqueを使用
矩形波を拡大したところ
音声サンプル(ドラム/ベース/ギター)
Cubase(elastique Pro-Time) 150%cb_el_150.mp3(848KB)
Cubase(elastique Pro-Time) 200%cb_el_200.mp3(1.12MB)
音声サンプル(ボーカル)
Cubase(elastique Pro-Time) 150%cb_el_v_150.mp3(215KB)
Cubase(elastique Pro-Time) 200%cb_el_v_200.mp3(285KB)

 ここでもう一つ気になったのが「elastique Formant」というアルゴリズム。名前からして、声質を意識したアルゴリズムのようだから、ボーカルには効果的なのかもしれない。というわけで、追加実験としてボーカルにのみ適用させてみた。聴いてみると分かる通り、150%はブツブツと途切れてしまい破綻してしまっている。一方、200%は非常にキレイな音ながら、先ほどのelastique Proでの結果とほとんど変わらないようだ。このことから考えるとelastique Proを選んでおくのが無難なようだ。

音声サンプル(ボーカル)
Cubase(elastique Formant) 150%cb_fo_v_150.mp3(215KB)
Cubase(elastique Formant) 200%cb_fo_v_200.mp3(285KB)

 以上、ProTools 11とCubase 7でのタイムストレッチの処理効果の違いを見てきたが、いかがだっただろうか? DAWによって、アルゴリズムによって、いろいろ違うことが分かったと思う。次回も、引き続き別のDAWでも同様の実験を行なっていく。

藤本健

 リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。  著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。EPUBマガジン「MAGon」で、「藤本健のDigital Audio Laboratory's Journal」を配信中。Twitterは@kenfujimoto