藤本健のDigital Audio Laboratory

第1002回

見えたぜオーディオの“ジッター”。PCMレコーダーを使った東大開発の測定方法とは

東京大学のホームページより

デジタルオーディオ機器の性能を見る上で、重要な要素の一つがサンプリングクロックのジッターだ。ジッターとはクロック波形の揺らぎを意味するもので、このジッターが大きいと音質が劣化すると言われているが、このジッターを測定すること自体が非常に困難と言われていた。

そうした中、今年8月に東京大学から「【研究成果】デジタルオーディオプレーヤーの再生性能を精密かつ手軽に測定する方法 ――サンプリングジッターの絶対測定――」というニュースが発表された。

それによると、「リニアPCMレコーダーが2台あれば、ジッターが測定できる」とのこと。一体どのようにすれば、ジッターが測定できるのか。同発表を行なった東京大学大学院総合文化研究科の齋藤晴雄教授と竹内誠助教に話を伺うことができたので、その方法やその仕組みなどを教えてもらうとともに、実際の測定結果などを見せてもらった。

東京大学駒場キャンパス正門
東京大学 大学院総合文化研究科・教養学部提供

ゼロクロス揺らぎの足し算・引き算で、再生機のジッターが求まる!?

――先日の発表を見て、「なぜ東大でジッターの測定方法の研究を?」と驚きました。具体的な話を伺う前に、この研究室では普段どんな研究をしているのか、紹介いただけますか?

齋藤氏(以下敬称略):私はこれまで陽電子に関する物理の研究を専門としてきました。陽電子は電子の反粒子ですが、これを物質にいれると様々な現象が発発生します。とくに陽電子が電子と結びつくと、ポジトロニウムという非常に軽い一種の原子ができるのですが、その性質に関する研究を続けています。

性質の研究と並行して、装置の研究も行なって来ました。その中でポジトロニウムがガンマ線に変わる際、ガンマ線の測定における時間精度を高める研究もしておりまして、そうした研究が、今回のジッター測定を探求するルーツにもなっている気はします。

東京大学 大学院総合文化研究科・教養学部 広域科学専攻・広域システム科学系、物理部会教授 齋藤晴雄氏

竹内:私は原子のレーザー分光を研究してきました。特に今回の分野に近い内容でいうと原子時計というものがあります。オーディオの世界でもルビジウムなどありますが、周波数安定化に関する研究を行なっています。

――ということは、オーディオそのものを研究しているわけではないのですね。

齋藤:昔からオーディオに興味を持っており、趣味でいろいろな機材を使っていました。オーディオの再生には、CDプレーヤーだったり、今であればデジタルオーディオプレーヤーを使う訳ですが、録音された音と再生した音は完全に同じにすることはできませんよね。

録音と再生の音が同じであるのが理想のオーディオと思うのですが、実際に測定してみるとかなりズレてしまう。なぜズレるのかと以前から疑問に思っていました。それが、2020年のコロナ禍になって、我々も大学に来るのが禁止され、授業もオンラインだけになった時期に、少し時間ができたことから、割と深く考えることがあったのです。そこで、竹内さんと協力して、いろいろと試してみた結果、面白い結果が出てきたというわけなのです。

――論文も発表されていますが、今回の“サンプリングジッターの絶対測定”について、かみ砕いて教えてください。

竹内:オーディオ機器から直接クロックを取り出すのではなく、ここではオーディオ機器で再生する音を見ています。サンプリングレート48kHzの機器で12kHzの正弦波を再生する場合、理想であれば図の左のようになり、ゼロクロス点は等間隔になります。ところがジッターを含んだ正弦波の場合は、右図のように等間隔になりません。

東京大学 大学院総合文化研究科 広域科学専攻 広域システム科学系、物理部会助教 竹内誠氏

竹内:S1、S2……をプロットしていくと、理想的には一本の直線の上に乗るはずですが、実際には上下にバラついています。ここで、理想的なゼロクロス時間と、実際のゼロクロス時間の差を「ZCF」(Zero Cross Fluctuation)と呼ぶことにし、これを見ていきます。S1での差を「⊿S1」、S2での差を「⊿S2」、S3での差を「⊿S3」……と求めていくことができます。

――ゼロクロス点だけに着目すると、確かにそうなりそうです。

竹内:この測定を24,000回、つまり12kHzなので1秒間行なった結果、横軸を回数、縦軸をZCFとしてプロットしていくと上の図のようになり、それを度数分布で表示すると下の図のようになります。これで標準偏差55.3ps(ピコ秒)のバラつきで、キレイに正規分布していくことが見えてきます。

齋藤:ただしこれは再生側のジッターも録音側のジッターも含まれている、というのが重要なポイントでもあります。実際のジッターを見るためには、ここから再生機側と録音機側のジッターを分離する必要があるのです。

そこで、再生機の音を録音機へ送る際、信号を2つに分離して、2台の録音機に送るようにしました。ここでは、録音機としてTASCAMのリニアPCMレコーダーである「DR-100MKIII」を2台使っています。

――2台の録音機があれば、分離できるとはどういうことですか? ここでの接続はアナログでの接続という理解でいいですか?

竹内:はい、アナログでの接続です。録音機のジッターがなければ話は簡単ですが、再生機と録音機の両方にジッターがある場合、足し算と引き算の差を用いることで、再生機だけのジッターを求めることができます。そのため2台の録音機を用意したのです。

――なるほど、これが今回発表された基本的な原理ということですね。再生側は48kHzのサンプリングレートで12kHzの正弦波ということでしたが、録音側のサンプリングレートはどのように設定しているのでしょう。

齋藤:これは192kHzに設定しています。ただ、192kHzであっても12kHzの正弦波を録るとなると、1周期につき16個の点しかサンプリングできないため、ピコ秒単位で求めるには点が足りない。そこで、FFTという方法を用いて補間をかけ、補間を十分に行なってから直線で繋いで求めるという方法を使っています。あとは各ゼロクロス点でのデルタを1個1個見ていくわけです。

――1個1個見るというのは、システム的に行なうわけですよね?

齋藤:最初にお見せした右のグラフは、あくまでも模式図的に描いたものであり、実際はこんなに極端な揺れがあるわけではありません。ごくわずかなピコ秒単位の揺れなので、パソコンでのプログラムで見ていく形になります。ただ実は、これだけでジッターが求められるわけではありません。下図にあるように、ジッターのほかにもノイズがあるからです。

齋藤:ジッターは基準発振器由来の時間のズレであるのに対し、縦軸にはAmplitude modulationという信号の大きさに依存するノイズがあります。一方横軸には位相に依存しないノイズ、時間によらず一様に乗るノイズがあります。こちらをPhase Independent noiseと名付けましたが、こうした3つが混在しています。

――ノイズについては再生機、録音機で増幅したり、アナログで伝送しているために発生しているわけですよね。このノイズを除去してジッターを取り出すにはどうしたらいいのでしょうか?

竹内:ここまでにおいて、ゼロクロス点の揺らぎを見ているので、ジッターとPhase independent noizeの合計が測定されています。これを再生機側で考えてみると、Phase Independent noiseはLとRそれぞれ別々で独立したもの、ジッターは共通のものなので、下図のような構造になっている、と仮定することができます。

竹内:ここで、下図の(b)と(c)を見比べてみてください。単純にLを録音しているか、LとRを足し合わせたものを録音しているかの違いになっています。

齋藤:LとRそれぞれのPhase Independent noiseはランダムですから足し合わせたときに、打ち消す部分もあるため、2倍にはならず√2倍にしかなりません。その違いでPhase Independent noiseの部分を抽出しているのです。

USB DAC/USBメモリー再生よりもCD再生の方が波形がキレイ!?

――少しパズルのようですが、こうした比較的単純な計算で、最終的にジッターだけを抽出することができる、というわけなんですね。実際に、測定した結果があったら、見せていただくことはできますか?

竹内:具体的な機種名は伏せますが、ここでは6種類のZCFの測定結果をお見せします。

竹内:まず1つ目はある機種において1秒間のジッターを見たところ、だいだい±0.1ns、幅として0.2nsのばらつきとなっていたのですが、最後のところで非連続的な変化が見られました。

竹内:実はこれが周期的、約1秒ごとに0.2ns程度、ZCFが非連続に変化していました。そこで、測定時間を10秒としてみた結果が下図になります。

竹内:こうして見ると、約1秒ごとに非連続な部分はありますが、全体的にはZCFの中心値が6.5ns程度ドリフトすることがわかりました。

――これがジッターの揺れを示すものなのですね。初めて見たデータのように思います。

竹内:続いて2つ目の機種の測定結果です。これはUSBメモリーに置いたファイルを再生したものですが、こちらも同じく10秒での測定結果です。今度はもう少し違うカーブを描くとともに、非周期的に1nsから2ns程度の、急激なZCFの変化があることが分かります。

齋藤:これは明らかに飛んでいるというか、問題が発生していることが見て取れます。

竹内:続いて3つ目の機種の測定です。まずはCDを再生させたものですが、CDは44.1kHzのサンプリングレートのため、12kHzの正弦波ではなく、11.025kHzの正弦波を再生して10秒間測定しました。ここではZCFは半値全幅で0.2ns程度で、ZCFの中心値が6.0ns程度ドリフトするのが見て取れます。

竹内:これを見ると比較的キレイな動きをしているのですが、この機種はUSB端子があり、PCとの接続も可能であることから、同じ44.1kHzのサンプリングレートでPC側から11.025kHzの正弦波を再生したものを1秒間で解析してみた結果、CD再生とは大きく異なるものとなりました。

竹内:ZCFの半値全幅で0.4ns程度となるとともに、ZCFの中心値が2.5ns程度ドリフトし、0.2秒から0.4秒ごとに大きく方向が変化する結果となりました。さらにこの機種はUSBメモリからのオーディオファイルの再生も可能なので、そちらも試してみた結果、先ほどのUSBメモリとも少し異なるものとなりました。ところどころ、完全に非連続となっているのです。

――データを読み飛ばしているというか、エラーが起きてる可能性もありそうですね。

齋藤:そうですね。実は、この3種類で再生したプレーヤーは私物なのですが、普段聴いていてCDはキレイに聴こえる気がしていたのが、USBメモリー再生はCD再生よりも音質が劣るように感じていたのはこのせいだったのかもしれません。

――ここまでハッキリとジッターが見えるとなると、かなり優れた測定器といえそうですが、これを今後、私たち一般ユーザーが利用できるようになる可能性はあるのでしょうか?

齋藤:まずはオーディオメーカーなどのような製品開発に関わる企業を対象に、ジッター測定の依頼を私たちの研究室Webサイトから受け付け始めたところです。これまで使ったプログラムを利用することで、装置的にはとてもシンプルな構成でジッターの測定を正確に行なえるので、価値は高いと考えています。今後これをどう公開するのかなどは、検討していきたいと思っています。

藤本健

リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。 著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。Twitterは@kenfujimoto