西田宗千佳のRandomTracking

第387回:

吹替・字幕・配信。ローカルを支えるグローバルNetflixの技術

 Netflixのプレスイベント「Netflix Lab Days」レポートの2本目は、同社のテクノロジーを中心に説明する。Netflixは「コンテンツ」と「テクノロジー」の2つの世界で成り立っている。コンテンツ制作の現場がロサンゼルスであり、配信を含めたテクノロジーの現場がロスガトス、という切り分けだ。

米サンフランシスコ近郊のロスガトスにある、Netflix本社。ここが創業の地であり、テクノロジー関連の社員はここに集まって仕事をしている

 筆者が感じた今年のテーマは「ユーザーデータ」。人々の行動を分析し、それにあわせてサービスを変えていくことが、同社のコアにある戦略であることが見えてくる。

 なお、Netflixのテクノロジーについては、一昨年昨年と2度に渡って本連載でも紹介させていただいている。そちらも併読していただければ幸いだ。

コンテンツを支える「技術」という柱

 Netflixの技術にかかわる面を統括しているのは、チーフ・プロダクトオフィサー(CPO)であるグレッグ・ピーターズ氏だ。Netflixに詳しい人は、彼のことを「日本法人のトップ」として記憶しているかもしれない。彼は昨年4月まで日本法人のトップとしてアジアの戦略を担当していたが、現在は本社でCPOとして、コンテンツとサービス両面を含めた「顧客体験」全体を統括する立場にいる。

Netflixのチーフ・プロダクトオフィサー(CPO)であるグレッグ・ピーターズ氏

ピーターズCPO(以下敬称略):我々の会社は2つの根本から成り立っている。ひとつはコンテンツであり、ひとつはテクノロジーだ。我々はそれら2つの世界の橋渡しをしつつ、最高のコンテンツと最高の体験を届けようとしている。

 私は10年前Netflixに入社したが、その頃はまだ小さなスタートアップ企業で、ネットストリーミングの世界に取り組み始めたばかりだった。今とはまったく異なる世界だ。5年前にオリジナルコンテンツ制作を開始し、2年前には、全世界190カ国への進出を完了した。世界の中でサービスを提供していないのは、ほぼ中国だけといっていい。契約者数は1億1,700万人を超え、大半がアメリカ国外での契約者だ。

 利用可能なデバイス数は1,700種類を超える。先月、Netflixへのアクセスには4億5,000万台のデバイスが使われた。どうすればみなさんが快適な接続と体験を得られるか、我々は常に考え続けている。

 そこで我々が重要だと考えているのは「ローカルであること」「個人であること」、そして「グローバルであること」だ。

 「ローカルであること」とは、世界中のどこに住んでいても、どの国に住んでいても、その言語で、UI・字幕・吹き替えを介し、コンテンツが利用できることを意味する。支払方法も、クレジットカードだけでなく、携帯電話事業者やケーブルテレビ事業者などのパートナーと提携し、地域毎に自由度を高めた。

 1億1,700万人のメンバーアカウントだが、ユーザープロファイルは「3億」を大きく超えている。一人一人のユーザーは別々の好みを持っている。だから、我々は一人一人に向けてカスタマイズし、個々のユーザー毎に異なる体験を提供できるよう、最適化している。すなわち我々は、3億の異なるバージョンのNetflixを提供しているのだ。

 こうしたカスタマイズにより、人々は多彩なコンテンツに触れることができる。ドイツで制作されたドラマである「DARK」は、90%以上がドイツ国外から視聴されている。何百万人もの「DARK」視聴者のほとんどは、これまでの生涯で、ドイツのドラマシリーズを見たことがなかっただろう。こうしたことは、ブラジルの「3%」でも、日本の「GODZILLA 怪獣惑星」でも繰り返されている。

 我々は素晴らしいコンテンツが好きだ。それを適切なタイミングで、より広い人々に見てもらうための技術を開発することに取り組んでいる。

 前回の記事でも述べたように、Netflixはオリジナルコンテンツの制作に力を入れている。だがそのためには、世界中の契約者にうまく届け、発見してもらう「テクノロジー」が必要になる。そのテクノロジーの部分を開発しているのがロスガトスのチームであり、その担当範囲はきわめて広い。

24カ国語で吹き替え、500の言語に対応する徹底ぶり

 グローバルなコンテンツ提供には、「多言語化」が前提になる。Netflixは、オリジナルコンテンツ調達を始めた時から多言語化を推進してきたが、過去と今とでは、その質や物量が大きく変わっている。

 2012年、同社のオリジナルコンテンツは7言語の吹き替えと、字幕・UI対応を含めた90ヶ国語への対応を実現していた。これでも、ディスクでの「他国語」対応に比べれば多い方だ。しかもディスクの時には、販売地域によって含まれない言語がある。

 だが2018年3月8日から配信が始まった「ジェシカ・ジョーンズ シーズン2」は、24の言語で吹き替えられ、字幕・UI対応は500にも及ぶ。

2012年には言語の吹き替えと、字幕・UI対応を含めた90カ国語への対応だったが、今は24カ国語の吹き替えに加え、UI対応は500言語にまで及ぶ

 もちろん、すべての作品で24言語での吹き替えが行なわれているわけではなく、作品によっては数言語の場合もあるという。だが、例えば子供番組の場合、吹き替え言語は「24」になる。なぜなら、子供達は字幕を読まないからだ。コンテンツの種類によって吹き替えの準備も変わるのだ。

 UIに関しても、フォントはもちろん、字幅・行間まで、Netflix社内に各言語の担当者がついて開発が行なわれている。2015年秋のローンチ時には、正直日本語化がまだまだ甘い……と思っていたのだが、現在は劇的に改善している。ヘブライ語やアラビア語のような右から左へ流れる言語への対応も、表示だけでなくレイアウトまで含めた最適化が行なわれている状況だ。

日本語とアラビア語のUIの違い。文字の流れる方向が異なるので、レイアウトも自動的に変わる

 今回、非常に面白かったのはポーランドでの吹き替えの例だ。ポーランドには「レクトリング(Lektoring)」というものがある。これは、映画などで元の台詞をそのまま活かし、その上に1人の話者ですべての登場人物の台詞をボイスオーバーしたものだ。元の台詞の上に、1人の話し言葉ですべての台詞がかぶって聞こえるので、誰がなにを話したか一瞬わかりづらく、我々からは非常に奇妙なものに見える。だがポーランドの人々には、これが求められる。吹き替えにしてしまうと「元の役者の声がなくなった」として、非常に不評なのだそうだ。だから、Netflixはポーランド向けに、この「レクトリング」もきちんと用意している。

 こうしたことは、同社が日常的にユーザー調査しているからこそ見えてくることだ。オンラインのものだけでなく、各地で実際にユーザーを集めてのリサーチも行なわれ、他国語対応の精度を高めている。以下の写真は、タイでの字幕精度を上げるためのリサーチのひとコマだ。視線の移動位置を計測して分析することで、字幕の量や表示位置、速度などを分析している。字幕の出し方まで調整できるのは、自社がアプリを作り、コンテンツの創出方法までコントロールできるからである。

タイでのリサーチの様子。画面上の赤い点が視線の位置を示している。どこをどのくらい見ているかを把握することで、字幕の出し方の最適化を行なっている

 吹き替えについても、各国からのフィードバックで改善が行なわれているという。フランスでは、我々がカラオケで使うような「文字が出てきて話すべきタイミングを示してくれる」ものがあり、それを見ながら吹き替えるのだという。

 また、日本の場合、吹き替えの収録は「集団型」だ。声優さんがスタジオに集まり、掛け合いをしながら演技をする。だが、これは世界的に見ると今は非常に珍しく、ほとんどが、役者が1人ずつバラバラに収録する。集中して収録できるので効率はいいのだが、演技の面では集団型の方がいい。「日本の声優さんが集団で演技をして録音するのは世界的に見ても、とてもユニークだが、そこで生まれるものからはとてもよい学びがあり、他の国の吹き替えの作業にもフィードバックしている」(国際吹き替え担当マネージャーのデニス・クリーガー氏)のだという。

Netflixの使い方は国によって大きく異なる

 とにかく顧客からのフィードバックを集め、サービスの改善に活かす、というのがNetflix流のやり方だ。ウェブサービスの会社ではよく見られる手法だが、それを巨大な映像配信の会社になった今も、愚直に続けているのがNetflixの特徴、ということもできる。

 プロダクト担当副社長のトッド・イェリン氏は、改良を繰り返す理由を「顧客に契約を継続してもらうため」と説明する。「快適であればあるほど、顧客はネットフリックスを使ってくれる」(イェリン氏)との分析から、改善を繰り返しているのだ。

Netflix・プロダクト担当副社長のトッド・イェリン氏

 それらのリサーチの中で得られた数字が公開されたのだが、特に興味深いものをいくつかご紹介したいと思う。

 まず、質問。Netflixでは、どんな端末からの視聴が多いだろうか?

 おそらく、「スマートフォン」か「テレビ」という声が多いように思える。正解は「入会からの時期によって、国によってまったく異なる」というものだ。

 写真は、全世界での視聴端末の割合が、入会から半年の間にどう変化したかを示すものである。最初はサインアップで文字入力が必要なので、PCやスマートフォンの比率が高い。しかし、マルチデバイスで視聴できるというNetflixの流儀に慣れてくると、次第にテレビでの視聴が増えてきて、半年後にはテレビ視聴の時間が延びる。

加入時期の変化による、端末ごとの利用時間の変化。慣れてくるとテレビに移行していくのがはっきり読み取れる

 また、この傾向は国によってもずいぶん変わる。アジアではモバイルからのサインアップ率が高く、視聴端末としてもモバイルの率が高い。ポーランドのようにPCが強い国もある。

国による、サインアップ時の端末比率と、視聴端末比率の違い。その国での端末利用状況で大きく変化するのがわかる

 日本は諸外国に比べテレビが強い。その理由を聞くと、「日本は他国に比べテレビのサイズも小さい。だが、部屋も小さいため、視聴距離が他国より短めだ。結果、見かけ上の迫力ではアメリカよりも上になる。そのため、テレビで見た時の満足度が高いようだ」(Netflix担当者)という分析があるのだとか。

 視聴時間についても、国によってずれがある。主に子供向け番組とそれ以外で各国の視聴量の変化を比較すると、曜日によって視聴傾向が違う国もあれば、まったくそうでない国もある。そして、時間帯による視聴傾向が大きく現れる国もあった。こうした傾向の分析により、ネットワークの最適化や対応する端末の開発など、多数のサービスに影響が出てくる。

子供番組とそれ以外での、時間帯・曜日による視聴量の変化を表したグラフ。国によってグラフの形が大きく違っており、生活習慣による影響が見えてくる。

「1日で1億4,000万時間」の再生を支える技術とは

 Netflixは現在、全世界で一日平均、1億4,000万時間の映像が再生されているという。だが、これが最高記録となると、3億5,000万時間にまで一気に跳ね上がる。なんと約4万年分だ。それだけの映像がインターネットを行き交っている、と思うとなかなかに恐ろしくなる。

 とはいえ、ご存じの方もいるだろうが、Netflixの映像は、すべてがインターネットを流れているわけではない。同社が「OpenConnet」と呼ぶ仕組みを使い、ほとんどの映像へのリクエストは、自宅からのアクセスの近く、ISPの中にあるキャッシュサーバーまでのアクセスで済んでいる。その地域の顧客が多く見る映像を、レコメンドなどの情報から分析して事前にキャッシュしているため、アメリカ本国までアクセスする必要が薄くなるのだ。この辺の詳しい仕組みは、2016年の記事で解説しているので、そちらをご参照いただきたい。

 今年もその点の新しい解説を受けた。昨年まで「ローカルのISPにあるキャッシュサーバーまでで終わる比率」は90%だったのだが、今年はさらにその比率が上がり、「細かなチューニングや対応強化によって、95%以上に達した」(Netflix・コンテンツデリバリー担当副社長のケン・フローレンス氏)という。

NetflixのCDNであるOpenConnectまででアクセスが終わる率は「95%以上」に。利用効率は昨年よりさらに5%向上した

 また映像のエンコーディングについても、新たに「ダイナミック・オプティマイザー・エンコーディング」という手法がとりいれられる。同社はこれまでも、コンテンツ毎に最適化したエンコーディング(2015年導入)、3秒単位での「チャンク」単位でのエンコーディング(2016年導入)を使い、低ビットレートでの画質向上に努めてきたが、今年は「ダイナミック・オプティマイザー・エンコーディング」で、さらに最適化を図る。これは、映像の撮影された「ショット」の違いを解析し、エンコーディングの設定をショット毎に変えるもの。1カットの間、撮影条件は似ているはずなので、エンコーディングの設定も同じがいいはず……という発想に基づく。エンコーディングの最適化が行なわれれば、データ消費量が減って「再バッファリング」が起きる可能性も減り、スマートフォンでのデータ使用量も減る……という発想である。

Netflixは今年、「ダイナミック・オプティマイザー・エンコーディング」と呼ばれる技術を導入。2015年に同社が使っていた技術に比べ、60%以上ビットレートを削減することに成功した

 この結果、270Kbpsで十分な画質での視聴が可能になり、月に4GBのプランでも、ドラマシリーズ全話を十分に見られる、26時間の視聴を実現した。

270Kbpsで視聴が可能になり、4GBのデータプランでも、26時間分ものドラマが見られるようになった

 もちろんこの技術は、高画質な映像を安定的に配信するためにも使える。だから、モバイルだけでなくテレビでも有効だ。海外では「Razer Phone」のように、4KかつHDR対応の映像が視聴できるスマートフォンも登場しているが、ここでも当然有効だ。

海外では発売中の「Razer Phone」。ゲーミングPCやゲーム用マウスなどでお馴染みのRazerが開発した「ゲーマー向けスマホ」。4K+HDR対応で、かつ120Hzのディスプレイを採用している

 なお、ダイナミック・オプティマイザー・エンコーディングは、iOS、Android、PlayStation 4、Xbox Oneで利用可能になっている、とのことだ。

各国の環境を「再現」して動作を確認

 Netflixはテレビで多く視聴されているが、モバイルデバイスでの伸びもきわめて大きい。そのため、モバイルデバイスでの体験を改善する開発が続けられている。ダイナミック・オプティマイザー・エンコーディングもそのひとつだが、もっと基本的な部分もある。

 写真は、同社内に設けられた「モバイル環境テストルーム」だ。多数の箱が並んだ部屋なのだが、この箱は、ひとつひとつが電波暗室であり、内部に空調も備えている。閉めて設定を変更すると、「特定の国の通信状態と気候を維持した空間」ができあがる。

背後に並んでいる箱は、モバイル環境をテストするための「電波暗室」になった箱。それだけでなく、空調なども備わっており、その箱だけで「特定の国の利用条件」をシミュレーションできる
箱の内部には、無線LANのアクセスポイントや携帯電話での通信をシミュレーションする機器が組み込まれ、大量のスマホやタブレットを同時に収納できる。箱を閉じれば「特定の国で使われるモバイル機器」の状況が再現できる

 国によって、電波状況や気温・湿度などは大きく異なる。そのため、そこでNetflixのアプリがどう動くかは、色々と変化する可能性が高い。本来、こうしたことはデバイスメーカーがやるべきテストに近いが、Netflixは社内に設備を設け、日夜大量のデバイスでの利用状況をモニタリングしながら開発している。

 ここまで大規模な環境を用意できるのは、グローバルなサービス提供を行なっているからだ。逆にいえば、ここまでやらないと全世界を相手に一気にサービス展開するのは難しい、ということなのかも知れない。

西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、週刊朝日、AERA、週刊東洋経済、GetNavi、デジモノステーションなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。
 近著に、「顧客を売り場へ直送する」「漂流するソニーのDNAプレイステーションで世界と戦った男たち」(講談社)、「電子書籍革命の真実未来の本 本のミライ」(エンターブレイン)、「ソニーとアップル」(朝日新聞出版)、「スマートテレビ」(KADOKAWA)などがある。
 メールマガジン「小寺・西田の『金曜ランチビュッフェ』」を小寺信良氏と共同で配信中。 Twitterは@mnishi41