西田宗千佳のRandomTracking
Netflixに見る、HDRを軸に進化する配信ビジネス。低レート高画質化や“サムアップ"
2017年3月30日 08:00
前回に続き、Netflix本社への取材レポートをお送りする。今回のテーマは「技術」だ。Netflixはオリジナルコンテンツ制作で伸びた会社だが、同時にテクノロジーカンパニーでもある。全社員の半数はエンジニアで、そのほとんどが本社である米カリフォルニア州・ロスガトスで働いている。現在Netflixがどのような技術に着目して働いているかを取材した。なお、今回は、Netflix本社とともに、サンフランシスコにあるドルビ−・ラボラトリーズ本社で、両社が協力して取り組んでいるHDRを中心とした話題も取材することができた。合わせてお伝えしたい。
筆者は昨年もNetflix本社を訪れており、色々と技術的な話題を取材している。昨年のレポートも合わせてお読みいただければ幸いだ。
作品に合わせたHDR処理でクオリティをアップ
まずはドルビーで取材した内容から話していこう。今回ドルビーとNetflixの取材が対になってセッティングされたのは、Netflixが同社のオリジナルコンテンツ制作と配信において、ドルビーがライセンスするHDR技術「Dolby Vision」を使っているからだ。今回はドルビー社内でDolby Visionに関わる取材を行なうことができた。
まず見られたのは、カラーグレーディングの様子だ。当然ながら撮影したデータはそのまま使われることはなく、シーンに合わせた色調補正が行なわれる。特にHDRでは、コントラストと色調をどう設計するか、が重要だ。
各作品に応じてカラーパレットが用意され、シーン毎にそれにあわせた色調補正が行なわれることで作品全体のトーンができあがる。映像はフレーム単位で解析され、指定した物体を追従する形で自動的に補正されていく。これにより、カラーグレーディングを担当するエンジニアの作業が大幅に軽減されている。
HDRといえば「明るさ」、というイメージがあるが、この段階で重視されているのは「解像感」だ。例えば花火や看板などでは、HDRによって微細な明るさが表現できるようになると、その部分の表示に精細感が生まれる。ダイナミックレンジの拡張により、人間はより解像感を感じるようになるのだ。だから、単に明るい部分が明るくなるようにではなく、必要な部分に解像感を出して、映像にリアリティが生まれるように処理している。
Dolby Visonは、HDRの記録方式として広く使われているHDR10に比べ、HDRを規定しているメタデータの量が多くなる。HDR10ではタイトルごとの規定だが、Dolby Visonではシーンごとに規定できるため、より表現が豊かになるわけだ。カラーグレーディングの時点でそうした要素を想定したデータを作り、さらに、SDRへ変換したデータも見ながら、「1つのソースから複数のソースをつくる」ことを考えて映像制作されている、という。
ちなみに、ドルビーでHDR作品のグレーディング作業を行なう場合には、同社が開発したマスターモニター通称「Pulser」がつかわれている。Pulserは液晶ディスプレイだが、最大4000nitsと非常に明るい表示が可能で、多数の分割数を持つ直下型でRGB各色を発色するバックライトが使われている。バックライトの発熱が大きいため水冷方式を採用している……という特別なものだ。今回筆者は初めて長時間見ることができたが、噂どおり素晴らしいクオリティであった。
ところでDolby Visonはどうやって開発されたのだろうか? 今回はそのリサーチで使われている、理化学研究用のラボも見学することができた。
HDRで使われる「PQカーブ」は、人間の認知に基づくデータから作られている。その影響を測るため、ドルビー社内には、映像を見ているときの生理的な変化を測定するラボがある。人はHDRの映像を見ていると生理的な変化を見せる。例えば焚き火の映像を見ると、顔の温度が変わる。実際には気温が変わっていなくても、顔を火で照らされたときのような変化を感じるためだ。そうした知見は映像づくりに生かされているという。
モバイルでのHDRは「バッテリ」にも「通信費削減」にもプラス
これまでHDRといえば、基本的にはテレビやプロジェクターのようなものが中心だった。だがドルビーとNetflixは、近いうちに「モバイルでのHDR」導入に取り組む。2月末にスペイン・バルセロナで開催された「Mobile World Congress 2017」では、Netflixのリード・ヘイスティングスCEOが基調講演を行ない、その中でモバイルでのHDR対応が発表された。LGエレクトロニクスは最新モデル「G6」で、モバイル向けDolby Visionの採用と、Netflixアプリでの対応を発表している。
今回はNetflixのチーフ・プロダクト・オフィサーであるNeil Hunt氏から、デモをまじえてその詳細を聞くことができた。
まず、映像をみていただくのがわかりやすいだろう。どちらも同じLGエレクトロニクスのスマートフォンなのだが、右はモバイルでのDolby Visionに対応した映像で、左はSDRの映像だ。色調や色合いが全く違うものになり、より自然なものになっているのがお分かりいただけるだろうか。
モバイルでのDolby Visonはテレビでのものと同じく、全てソフトウェアで実装されており、デモに使われたものもおなじハードウェアを使っている。両者でおどろくほどの違いが出ていることに注目していただきたい。
Hunt氏(以下敬称略):Dolby Visionはストーリーを伝える上で非常に優れたツールです。我々はたくさんのオリジナル作品を提供しており、DVDクオリティからBlu-rayクオリティへ、そして4K+HDRクオリティへと移行しています。Dolby Visonは、テレビからモバイルまで幅広く、同じ体験を提供できます。モバイルにおいては2Kまでの解像度が中心に使われることになりますが、4K+HDRのテレビにより近い映像になります。
モバイルでDolby Visonを採用する、ということには、いくつもの利点があります。一般的なHDR(HDR10)に比べ、10%データ量を削減できます。また、動画再生時のバッテリ消費は、SDRとDolby Visonを比べると、Dolby Visonの方が15%削減できます。すなわち、品質を上げた上で、帯域もバッテリも節約できるのです。
バッテリ消費の点については、多少補足が必要かもしれない。モバイルでのバッテリ消費は、ほとんどがディスプレイで起きる。明るい場所ではより明るく表示する必要があり、それが大きく関係してくる。モバイルの場合、テレビとは異なり、動画では暗いシーンがあってもバックライトを絞ることは少ない。だがDolby Visonでは映像の色調を巧みにコントロールし、さらに明るさもコントロールするため、体感上は十分な輝度があるものの、トータルでの時間単位での輝度を下げることができる。15%、というのはベストケースと思われ、常にそこまで差が出るかは議論と検証の余地があるものの、Dolby Visonの採用が、モバイルにおいて画質とバッテリ消費の両面でプラスになることは間違いないようだ。
「圧縮技術」の見直しで半分のビットレートで同等の画質に
ここからはNetflix社内での取材の話をしよう。
先ほどモバイルでのHDRの話がでたが、Netflixにとって現在、モバイルへの対応は最優先課題になっている。日本や韓国は、モバイルでの利用率が高いことでしられている。これらの国々は回線品質が良く、個人が移動しながら、もしくは個室でスマホ・タブレットから視聴する例が多い。だが、「モバイルが重要」な国は他にもある。インドなどでもモバイルでの利用が多いという。だがこうした国々の場合、回線品質は必ずしもすべての場所で良好ではない。また、1カ月に使えるデータ量も比較的少なめだ。日本は昨年、MVNOの低価格化と大手3社の「大容量プラン」シフトにより、比較的恵まれた環境になっている。しかしそれでも、動画に使うデータ量は少ないに越したことはない。
ここについて、Netflixは今年中に大きな対策に乗り出す。
まず以下の画像を見ていただきたい。これは、現在使われている技術で「100kbps以下」のビットレートで配信した映像と、これから導入を予定している技術を使って配信したときの差を示したものだ。100kbpsというと、ブロックノイズが出て見るに耐えないもの……という印象があるが、新しい技術によるものは、かなり見やすくなっている。
同社で圧縮技術を担当するAnne Aaron氏は「100kbpsという最低の水準でも、さほど問題はなくなる。これまでの半分のビットレートで、多くの人が満足できるものになるのでは」と見通しを語る。実際映像を見比べると、現在は555kbpsが必要な映像が、新しい技術では277kbps程度で実現できているのがわかる。
Aaron:私たちは現在、エンコーディング技術の改善にとり組んでいます。この技術はまずモバイルに活用され、将来はすべてのエンコーディングに使われると考えていますが、まずはモバイル向けです。
エンコーディングにおいて重要なのは、我々が見ている映像によって、必要なパラメータは全く異なる、ということです。子供向けのシンプルなアニメは、背景がこっていないのでそれに合わせるとビットレートを節約できます。でも同じアニメでも、キラキラ星が飛び交ってお花畑にいるシーンが多い回では、ぜんぜん条件が違います。実写でも、アクションと一般的なドラマでは違いますし、暗いシーンが多い回とそうでない回では異なります。
ですから我々は、映像を作品ごと・各話ごとに解析した上で、映像を1から3分ごとの小さな「チャンク」にわけ、チャンク単位で最適なパラメータを見つける解析を行った上で、新しい世代のコーデックを使って圧縮することにしました。新しいエンコーディングでは、圧縮のコーデックに「VP9」を使います。
このアプローチは2015年から開発を、いくつかの大学と共同でスタートしましたが、今年中に運用をスタートします。
ちなみに、Netflixはこれらのエンコーディングを、全てアマゾンのクラウドサービスである「Amazon Web Services(AWS)」で行なっている。Netflixは最大級のクラウドカンパニーであると同時に、最大級の「クラウドサービス利用者」でもある。
Netflixは配信ネットワークにおいても多くの工夫をこらしている。自社で配信をキャッシュするサーバーアプライアンスを開発し、世界中のISPやIX(インターネットエクスチェンジ。ISPやデータセンター同士が相互接続する場所)に配っている。結果、現在はNetflixへのトラフィックのうち、95%がインターネットの基幹ネットワークには出ていくことなく、キャッシュサーバーまでのアクセスで終了しているという。だから、太平洋や大西洋を渡るネットワークに負荷をかけることもなく、世界同時に映像を配信できているのだ。このネットワークをNetflixは「OpenConnect」と呼んでいる。
この辺は昨年のレポートに詳しいのでそちらを参照していただきたいが、新しい情報が得られたので、それを公開しておきたい。
写真は、実際にキャッシュサーバーが置かれている場所だ。緑がISP内の、オレンジがIX内のキャッシュサーバーを示している。日本にも東京・大阪など数カ所にサーバーがあるのがわかるが、なにより圧倒的なのが、アメリカ国内及びヨーロッパ、南アメリカのキャッシュサーバーの量である。これらの地域に、日本からでは想像もできないほどのトラフィックが存在し、それを膨大なキャッシュサーバーが支えているのだ。また、アジアでは東京とシンガポールにキャッシュサーバーが多く、重要視されているのも見えてくる。
4月中に「星」が消えて「サムアップ」に
Netflixの技術的特徴といえば「パーソナライズとレコメンデーション」にある。同社は視聴状況について綿密なデータを収集している。また、各作品に多彩な「メタデータ」をつけ、どのような人がどのような作品を好むか、を解析し、それを利用者へのレコメンデーションに利用している。レコメンデーションの精度を上げることで「次に見るものがみつからない」という不満を減らし、顧客の長期的な利用につながる……というのが、同社のビジネスモデルの根幹である。
そのレコメンデーションの情報のひとつが、利用者が設定する「星によるレーティング」だ。いや、「だった」というべきか。良い作品には良いレーティングがつき、あなたが見るべきか否かを判断する指針になっていた。
だが、このやり方は近日中、4月のうちに変更になる。
プロダクト・イノベーション担当副社長のTodd Yellin氏は、今後のやり方について次のように解説した。
Yellin:現在まで、多くの人が「5つ星」の評価を行なっています。Netflixに蓄積された5つ星の数は100億を超えます。あるものに5つ星をつける人は、より気に入らないものに3つ星をつけるでしょう。しかし、これは本当に意味を持っているのでしょうか?
「あなたが好きなものを評価する」ことと、「それを実際に見る」ことはシグナルとして、非常に強いものです。昨年みたものと昨夜みたものとでは、どちらを優先にすべきでしょうか? そこには暗黙の、重視すべきなにかがあります。
とはいえ、明示的に「気に入ったものを指示する」ことは重視しなければなりません。
そこで、私たちはもっとシンプルにすることにしました。「5つ星」から「サムアップ」に変えます。こちらの方がシンプル。ちょっとタップするだけです。数多くのテストを行なった結果、こちらの方が良い、との結論に至りました。もはや、「サムアップ・サムダウン」は、国際的なインターネット・ランゲージと言っていいものです。
Yellin:これから、各作品には星ではなく、「おすすめ(Suggest)」が出ます。これはえーっと、マッチング(出会い系)サービスのアレと同じです。みんな使った事あるでしょう?(笑) この作品がどれだけの評価を得ているかではなく、「あなたにとって何%おすすめなのか」が表示されるようになるのです。
Netflixから「星」が姿を消すことは非常に面白い現象だ。昔から人は「レーティング」を好んできたが、今のような使い方では、結局、星の数より「評価したいと思う意思」に大きな価値があり、それ以外の部分はふだんの視聴行動から得られるデータの方が重要……ということなのだろう。考えてみれば、多くのサービスから「星」は姿を消している。YouTubeもApple Musicも「好む」ということを示す「サムアップ」もしくは「Love」に変わった。
これもまた、今の人々の行動と、そこから得られる情報の価値を示す、一つの傾向といえそうだ。