藤本健のDigital Audio Laboratory

第831回

高音質ライブストリーミングをもっと手軽に。コルグが1bitで新たな取り組み

早稲田大学 西早稲田キャンパスにおいて、第20回目となる「1ビット研究会」が12月4日に開催された。DSDやSuperAudio CDなど1bitオーディオに関連する研究者、開発者、メーカーなどが数多く集まるこの会で、今回もさまざまな発表が行なわれた。

その第1部の特別講演では「1ビットオーディオのターニングポイント」と題し、コルグの執行役員で技術開発部 部長である大石耕史氏が過去20年の技術進化を振り返る講演を行ない、その後半で現在開発中というユニークな試みに関する発表もあった。これらがどんな内容で、どのような可能性を持つものなのか紹介しよう。

1bitにまつわるユニークな内容が発表

2000年にスタートした1ビットコンソーシアムを前身とする1ビット研究会は、長い歴史を持つ研究会となっており、筆者も何度となく取材しては、このDigital Audio Laboratoryでもレポートしてきた。

今回の1ビット研究会のプログラムは大きく5つのプレゼンテーションがあり、興味深いテーマもいろいろあった。「二・二六事件の電話を傍受した線速度一定録音盤の再生」は、同事件において電話局で傍受してレコードに記録した内容を1ビットオーディオ技術などを用いて解析するというもの。先日NHKで放送された番組に関する裏話的な内容だった。

5つのプレゼンテーションがあった
二・二六事件の電話を傍受して、1bitオーディオ技術などを用いて解析したという

また、「MEMSマイクを使ったカートリッジの開発」は、レコードカートリッジのピックアップ部にMEMSマイクを使用することで高音質なレコード再生が可能になるという試みについての内容だった。

MEMSマイクを使ったカートリッジの開発

そうした中、最初の特別講演では、コルグの大石氏が、「1bitオーディオレコーダー」、「PCと1bitオーディオ」、「インターネット・ライブ・ストリーミング」というテーマでの20年間を振り返り、いろいろと懐かしい内容もいっぱいだった。

コルグの執行役員で技術開発部 部長である大石耕史氏
20年前を振り返る

そして後半では、未来に迎えた未公開技術を交えた発表ということで「UPnP AVの可能性」、「インターネット・ライブ・ストリーミング配信の未来」というテーマでの講演を行なった。ここでは、その後半の2つについて見ていく。

大石氏の講演内容

ワイヤレス活用で音楽再生を手軽に高音質で楽しむ

そもそもUPnP(Universal Plug and Play) AV自体は2002年に策定された古くから存在する規格。ホームネットワークに接続されたAV機器同士が事前の設定なしに相互接続し、音楽やビデオを再生するための企画として登場したのだが、当初はなかなか普及しなかった。LINNを中心とする団体がUPnPの欠点を改善し、ネットワークオーディオに特化した「OpenHome」を作成すると、大きく広まっていった。

「DLNA」、パナソニックの「お部屋ジャンプリンク」、ソニーの「ルームリンク」は、名前が違うけれど、使われている技術は基本的に同じものだ。そのUPnP AV機器であるDLNAにおいて、DSDに関しての正式な規定は現在もないまま(DLNA認証の団体Digital Living Network Allianceは2017年に解散)ではあるが、2013年よりMIME Type “audio/x-dsd”にてDSDIFFおよびDSFファイルの取り扱いが一般的化している。

DSDに限らず、DLNAを用いた代表的なオーディオ再生モデルとしては2つのパターンがある。1つはデジタル・メディア・サーバーとデジタル・メディア・プレーヤーを接続、プレーヤー側で直接操作をして音楽ファイルをサーバーからダウンロードして再生するもの。もう1つは音のデータの流れ自体は同じだが、コントロール自体はスマホなどを用いるものだ。この場合、リモコンアプリで操作を行なうとサーバー側、プレーヤー(レンダラー)側双方にコントロール情報を送って再生する形になる。

DLNAを使ったオーディオ再生の代表的な方法

大石氏が提案するのは「2-box push」というモデル。つまりサーバーからデータを引っ張り出すのではなく、スマホに入っているデータをレンダラーにプッシュ伝送を行なって再生するという。いわばワイヤレスDACともいえる接続だ。

大石氏が提案する「2-box push」

実際に、コルグ社内においてスマホではなくWindows PCを用いたテストを行ない、PC内のDSFファイルをネットワーク越しに再生させることができたという。

ローカルのDSFファイルをネットワークプレーヤーにプッシュ再生

これをさらにもう一歩進めたのが、インターネット・ストリーミング・サービスを活用しつつ、レンダラーで再生しようというもの。従来であればストリーミングした結果はスマホ自体で再生する形だったが、それをそのままネットワークを経由してレンダラーへ送り、より高品位なオーディオ機器で再生しようというのが狙いだ。

インターネットストリーミングサービスを活用してレンダラーで再生

これにおいてもコルグの社内の実験において、PrimeSeatのオンデマンドコンテンツ(DSD 5.6MHz)を既存のネットワークプレーヤーで再生することができ、さらにPrimeSeatのライブコンテンツ(PCM 48kHz)も同様に再生することができたという。

確かにDLNAというと普通はネットワークサーバーにコンテンツを揃える必要があり、それだけのために自宅にサーバーを立てることに抵抗を感じる人も少なくないはず。一方で、誰もがスマホを持ち、その中にコンテンツを持っていたり、ストリーミングサービスを利用しているわけだから、それを自宅ではスマホで再生するのではなく、より音質のいいオーディオ機器で再生できれば断然便利になる。もちろん、USB DACなどを使って再生する手段はあるが、いちいちオーディオ機器のそばに行き、そこに接続するというのは面倒なので、すべてワイヤレスでできるようになれば理想的だと思う。

小規模な配信システムで、Webブラウザ視聴できる高音質配信

そして、大石氏によるもう一つの提案が「インターネット・ライブ・ストリーミング配信の未来」というテーマ。これまでも高解像度映像+ハイレゾ音声での配信というのは、いろいろと実験的な試みが行なわれてきた。今年2月にIIJが行なった4K+ハイレゾストリーミングは、1bitオーディオではなく96kHz/24bitのPCMではあったのは、この連載でもレポートした通りだ。

IIJが2月に行なった4K+ハイレゾストリーミング配信

ただその時の記事でも書いた通り、これを実現するにはさまざまなハードウェアが必要でかなり大規模な配信システムになってしまうこと、再生に専用のクライアントが必要であること、そしてこのシステムでは1bitオーディオには対応できないという技術的な課題があった。そこで大石氏は、できるだけコンパクトな配信システムであること、一般的なウェブブラウザでも再生可能にすること、専用の再生クライアントを使った高品位再生も可能にすること、という3つの方向性を打ち出し、実験に取り組んでいるという。

その実例が示されたのだが、まずプレーヤーにおいてはChromeなどのブラウザ上で動くShaka Playerを使うという手法だ。ご存知の通り、Shaka PlayerはMPEG-DASHとHLS再生に対応したオープンソースのJavaScriptライブラリで構成されており、Web標準のMSE(Media Source Extensions)とEME(Encrypted Media Extensions)に対応したブラウザであれば動作する。各ブラウザで対応する動画・音声コーデックの対応状況についても一覧で説明された。

各Webブラウザでの動画/音声コーデック対応状況

これを考えるとFLACがもっとも汎用性が高いので、1bitオーディオもFLACに収録してしまおうというのが大石氏の提案。つまり、少し冗長性が出る面はあるけれど、1bitオーディオ信号にDoP(DSD over PCM)フラグを付けて疑似PCM化した上で、FLACエンコードし、最終的に映像とセットにしてMP4コンテナに格納するのだ。このDoPフラグ部分がかなり単純なコードであるために圧縮率も高くなり、伝送ビットレートも抑えることができるという。

1bitオーディオ信号の取り扱い

実際にこの手法を用いた1bitオーディオ信号と4Kの映像をMPEG-DASH形式でライブストリーミング配信をするという実験をコルグ社内で行なったという。物理的には社内の隣のスタジオへ4K映像と5.6MHzのDSDオーディオを送るというものだったが、高音質・高画質で送ることができたという。ちなみに4K映像はIntel CPUに搭載されているGPUアクセラレータによってH.264にリアルタイムエンコードしたものを使用したという。

4K映像+1bit音声ライブ配信ソフトウェア
ライブ配信システムのデモ

このシステムを見る限り、特殊な装置、大掛かりなシステムは不要で、比較的手軽にできそうだ。もっとも、ここでは市販されていないコルグのDSDオーディオインターフェイスであるMR-0808Uが使われていたので、こうしたものをどう調達するかがキーにはなりそうだが、アナログ2chであればコルグのDAC/ADCであるNu 1でも対応可能とのことだった。

一方で、気になるのはShaka Playerを使って本当にDSDの再生ができるのか、という点。Macであれば、CoreAudioドライバで再生できるので、大きな問題はないように思うが、Windowsの場合、ブラウザからASIOドライバは掴めないため、MMEドライバ、DirectSoundドライバ、WASAPIドライバを使うにせよ、Windowsのオーディオエンジン(旧称:カーネルミキサー)を経由するため、信号の変質してしまい、DoPの復元ができないのではないか、ということ。

4K映像+1bit音声ライブストリーム再生システムの実験の構成

これについて大石氏は「Windowsのサウンド設定においてサンプリングレートを352.8kHzに設定するとともに、音量を最大にすることで、Windowsオーディオエンジンを経由しても問題なくビットパーフェクトでの再生ができる」という。もしかしたら、DoP信号だとPCMとして見たとき最大音にならずリミッターがかからないので、信号がビットパーフェクトで送られるということなのかもしれない。少しリスキーな感じもするが、ぜひこの辺もうまく実現してくれると面白くなりそうだ。

もちろんこうしたことはコルグ1社でできるものではないので、こうした場で発表し、多くのメーカーにも呼び掛けていくとのこと。ユーザーにとっても便利で、嬉しい環境が実現するのであれば、ぜひ期待したいところだ。

藤本健

 リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。  著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。Twitterは@kenfujimoto