西田宗千佳のRandomTracking

第436回

HoloLens 2は「空間を超えたコミュニケーション」へ。キップマン氏が語る

マイクロソフト「HoloLens」の産みの親、アレックス・キップマン氏への単独インタビューをお届けする。

マイクロソフト・テクニカルフェローのアレックス・キップマン氏

今回キップマン氏は、5月29日・30日の2日間開催されている日本マイクロソフトの開発者イベント「de:code 2019」のために来日した。もちろん、今年2月に発表した「HoloLens 2」を日本でお披露目するためだ。

HoloLens 2でなにを狙っているのか、そして、今後のマイクロソフトにおける「Mixed Reality市場」への取り組みについて聞いた。

なお、HoloLens 2の詳細については、「MWC19 Barcelona」取材時のレポートで詳しく解説しているので、その記事を併読していただければ幸いだ。

MWC19 Barcelonaでも登場したHoloLens 2

HoloLens 2のカギは「インプット」と「アウトプット」の没入感拡大

HoloLens 2への反響をどう見ているか? キップマン氏は「デベロッパーに好評であればいいのだけれど」と話す。

キップマン氏(以下敬称略):良い反応であることを期待しています。

今回は開発者のコミュニティに会うために来日したようなものです。私は日本が好きですし、日本のHoloLens開発者コミュニティの熱気もすばらしいと思っています。

HoloLens 2の新しい機能のほとんどは、彼らのために開発されたようなものですから、開発者コミュニティのみなさんに気に入ってもらえることを願っています。

HoloLens 2は、いままでよりも快適にかぶることができて、視野も広くなり、指の認識にも対応した。それらの改良は、どのような観点で生まれたものなのだろうか?

キップマン:今回の発表の内容をじっくり見てください。どう使う? どう快適に、どう没入し、より迅速に価値を出すにはどうすべきか?

私たちは没入感を「インプットの没入感」と「アウトプットの没入感」に分けました。アウトプットは、あなたの目にホログラムがどう見えのか、という部分です。解像度向上や視野角の向上がこれにあたります。

インプットの没入感は、ホログラムとどうインタラクションするのか、ということです。視線認識は、空間の利用を意味的に理解するために追加しました。多関節を物理的な法則に基づいて認識するので、指などの動きも取れます。結果として、ホログラムへのインタラクションはより密になります。このために最新技術をつぎ込みました。

なぜこうしたのか? 「物理的にそこにいる」のと同じ状態を作り出すことが理想だからです。あなたが東京にいて、私がシアトルにいるとしても、同じように「ここにいる」体験ができるよう、Mixed Realityを生成するのが目標です。

この発言の意味は、de:code 2019の基調講演でキップマン氏が行なったデモを見るのがわかりやすい。これは日本で行なわれるde:codeのために作られたオリジナルのもので、ここが初お披露目だ。

壇上には、キップマン氏の3Dキャプチャモデルが現れる。壇上に複数現れて格闘をしたりするが、まあ、それはご愛敬。会場もいっきに空気がほぐれた。

de:code 2019の基調講演で、キップマン氏はHoloLens 2を日本にお披露目。自身の3Dモデル同士が格闘するデモも見せた

最後に彼が行なったのは、CGのキップマン氏に「日本語でスピーチをさせる」ということだ。といっても、事前に誰かが吹替音声を収録したのではない。日本語でしゃべっているが、声色はキップマン氏自身のものだ。仕組みとしては、彼のスピーチ原稿を自動翻訳し、さらに、マイクロソフトが作った「本人の声を学習して話す音声合成」を使い、そこに翻訳原稿を流し込むという形である。

手前にいる、HoloLens 2をかぶっていないキップマン氏はCG。彼の声色で、日本語でスピーチを行なっている

自動翻訳なので違和感は残るし、そこは音声合成も同じだ。しかし、「その場に本人が現れ、本人の声で、本人がしゃべれない国の言葉で話す」というのは、なかなかにインパクトが大きい。ひとつひとつの技術に分解すれば、確かに「いまなら出来る」ものなのだが、それを組み合わせると、「本人がその場にいなくても壇上に現れてスピーチをする」という、SFのようなことが実現できる。

実際にやるには、3Dモデルや音声モデルの用意、モーション付けなど、ハードルももちろんある。しかし、「場所を超えてその場にいる感覚でコミュニケーションをする」ことは、もはやさほど夢物語ではない……ということが感じられる。

なおちょっとしたことだが、今回から、HoloLensのデモに使う機材が大幅にシンプル化していたことにも注目しておきたい。

HoloLensは人がかけて使う機器なので、デモなどの目的から、使っている人が見ている視界を他人と共有するのはちょっと面倒だ。そのため、外部機器やカメラと連動して見せるのが「Spectator View」という機能だ。

従来のデモでは、一眼レフカメラとHoloLensを組み合わせた「Spectator View Pro」と呼ばれるものが必須で、かなり大柄な機材を使う必要があった。MWCでのHoloLens 2の発表会でも、同様のシステムが使われていた。

今年2月、MWC19でHoloLens 2のデモ中継に使われていた機材。現在の装備に比べるとかなり大がかりだった

だが現在は、iOS端末を使う「Spectator View」が用意され、機材が一気にシンプルになった。de:codeの基調講演で使われていたのもこの仕組みであり、iPhoneとジンバルだけ、というとてもシンプルな機材に変わっている。

de:codeの基調講演でのデモ。スマートフォン(おそらくiPhone)をジンバルにつけただけの、シンプルな機材で中継された

これであれば、教育向けや研修向けなど、大げさな機材を大量に用意できないシーンでも、HoloLens 2の視界を活用したデモが行なえる。

詳しくはマイクロソフトの以下のサイトに情報が記載されている。

HoloLensのspectator ビュー
https://docs.microsoft.com/ja-jp/windows/mixed-reality/spectator-view

快適になったHoloLens 2。目線で文章をスクロール、アイアンマン感覚でメニュー呼び出し

HoloLens 2は完成形なのか? もちろん違う。HoloLensから学んだ「現状の結果」であり、キップマン氏はさらに先を目指している。

キップマン:もちろん、まだまだやることはあります。特に「快適さ」についての課題は大きいでしょう。メガネのように、一日中見ていられるようにすべきです。

よりイマーシブに、より快適に。これは私たちのマントラです。仕事からコミュニケーション、生活まですべてを横断し、使いつづけて、現実「以上」のものを実現する、というのが私たちの目標であり、そのために学び続けています。

今回の取材中、筆者は、改めてHoloLens 2を体験する機会に恵まれた。2月にMWCで発表された時にも体験しているが、じっくり触って改めてわかった点をお伝えしておきたい。

HoloLens 2の実機
キップマン氏にもHoloLens 2をかぶっていただいた。従来よりもバランスが良く、帽子をかぶるようにスッとつけられるのが特徴だ

視野角はやはり、過去のHoloLensに比べてずいぶん快適になった。VR機器のように広いわけではないが、上下への広がりが特に大きいことから、「映像を視界に捉えるために首を動かす」頻度が減る。

物体をつまんだり握ったりして操作できるのだが、「物体をつまむ」「物体を握る」「物体の外側に出ているボックス(拡大縮小用)を掴む」というそれぞれの操作で、音が少しずつ違う。

また、MWCの時には試せなかったもので、今回新たにチェックできたのが「視線認識」による操作と、ホームメニューの出し方だ。

HoloLens 2には視線認識機能が組み込まれている。これを使うと、物体やメニューの選択の他に、文章のスクロールなどができる。今回体験できたデモの中にも、視線による文章のスクロール機能が盛り込まれていた。四角いウインドウ内の文章を読んでいき、視線が下辺に近づくと、中身に文章が自動的にスクロールする。特にひっかかりもなく、スムーズに操舵できた。両手を使わずに文章が読めるので、作業しながらのマニュアルチェックなどに有効だと感じた。もちろんコンシューマ向けに出た時には、「食事しながらウェブの記事を読む」といった自堕落な用途に活躍しそうだ。

スタートメニューの表示は、手首の内側をタップする動作に変わった。従来は手のひらをうえに開く「ブルーム」という動作を使っていたが、誤動作の可能性もあることから、今回の形に変わった。デモ担当者は「腕を指でタップするので、触ったという感覚もある。フィードバックがあるので、いままでのブルームよりもずっとわかりやすく、間違いも起きにくいのでは」と話す。体験した筆者も同感だ。なにより、なんとなく「アイアンマン感」があって、ちょっとワクワクする。

クラウドで「空間地図を共有」する意味とは

HoloLens 2の発表にあわせ、マイクロソフトは各種のクラウドサービスも発表した。特に注目なのは、AR空間内での「位置情報」を共有し、同じ体験を複数の端末で共有するために必要な「Spatial Anchors」という技術だ。簡単にいえば「現実空間を3D化し、どこにAR物体が置かれているか」という地図を共有するために必要なものだ。

HoloLensを含め、あらゆるAR機器は、現実空間に仮想の物体をマッピングしている。現状、そうした情報は機器内に留められ、自分だけが使っている状態だ。だが、人と空間を共有し、コラボレーションするなら、そうした情報の共有は必然である。

Spatial Anchorsでは、そのデータをマイクロソフトのクラウドであるAzure上で処理し、アーキテクチャの違うデバイス同士でも使えるようにすることだ。HoloLens同士だけでなく、HoloLensとiOSデバイス、Androidデバイスが、同じ空間を共有できるようになる。

この機能がカギであることを、キップマン氏は認める。一方で、「世界中の空間データをマイクロソフトに集めるために使う」という意思については否定した。

キップマン:この点を考える時は、インテリジェントクラウドとインテリジェントエッジ、両方の概念を考える必要があります。

私たちの知性はどう動いているのでしょうか? 大半は「エッジ」(自分の中)です。目の前のボトルを取るとします。そのためには、目に入ってくる光から、あまり遅れずに処理が行なえる必要があります。(実際に目の前のペットボトルを手に取って)ここまでの時間は9ミリ秒。これをクラウドに回している時間はありません。だから、エッジでインテリジェントな処理をする必要があります。HoloLens 2にインテリジェントな間接認識機能を入れたのは、そのためです。部屋の明るさをそれぞれの個人が認識するには、エッジ処理に頼る必要があります。

一方で、インテリジェントクラウドでは、より時間をかけて処理ができます。データがかえってくるのに2秒かかったとしても、場合によっては許されます。精度も演算能力もどんどん上げていけます。空間を高い精度で処理するなら、そちらの方がいいでしょう。Spatial Anchorsでは、HoloLens 2のようなエッジデバイスでも、(iOSの)ARKitでも、(Androidの)ARCoreも扱えます。

究極のAIを実現するならば、クラウドとエッジ、両方を用意する必要があるのです。

一方、Spatial Anchorsは「基礎技術」です。これで永続的に使える、世界の空間地図を作ろうとしているわけではありません。あくまで、ユーザー単位でデータは別れています。プライバシーを保つためです。もちろん、あるデベロッパーが、この機能をつかって非常に広い領域の空間地図を作ることはできるでしょう。しかしそれはあくまで、そのデベロッパーの選択であり、マイクロソフトを含めた他の人々が再利用することはできません。

先日、我々のチームと「Minecraft」を開発しているMicrosoftゲームスタジオは共同で、「Minecraft Earth」を発表しました。このゲームでは、地球全体でMinecraftを楽しむためにSpatial Anchorsを活用しています。ですが、それはあくまで彼らの選択であり、このゲームの中での「持続的な空間地図」なのです。

MinecraftのAR版である「Minecraft Earth」。Spatial Anchorsを技術基盤として使い、世界中をプレイフィールドにしてMinecraftを楽しめる。2019年中にサービス開始

開発者に自由を! アプリストアのオープン化と「安価なサブスクリプション版」の狙い

HoloLens 2において、マイクロソフトは3つの「自由」を方針として打ち出した。

ひとつは、「アプリストア選択の自由」。スマホではOSベンダーのアプリストアを使うのが基本だが、HoloLens 2では、マイクロソフトのストアに縛らない。どの企業も自由にストアを作っていいし、ストアを使わなくてもいい。

ふたつめは「ウェブブラウザーの自由」。マイクロソフトのウェブブラウザーといえば「Edge」。HoloLensもコアはWindowsであることに変わりはなく、ウェブブラウザーとしてEdgeを搭載している。だが、他社も自由にウェブブラウザーを開発することができる。実際すでに、FirefoxがHoloLens 2版の開発を表明している。

そして最後が「開発環境の自由」。これまではUnityを使って開発するのが基本だったが、どんな環境を使ってもいい。Unreal Engineのサポートも決まっている。

特に大きいのは「アプリストア選択の自由」だろう。これは、マイクロソフト・ストアだけを使っていた初代HoloLensから大きな変更のようにも思える。しかしキップマン氏は「こうなるのが自然なことだった」と話す。

キップマン:コンピュータの歴史は価値創造の歴史であり、それは哲学でもあります。価値創造を維持するには、そのプロセスは自由であるべきであり、税のようなものはない方がいいのです。PCは生まれて以来、最大のオープンなエコシステムであり、様々な価値創造が生まれました。Windowsはいまだ存在する最大のオープンプラットフォームのひとつであり、マイクロソフトはオープンソースへも多大な貢献をしています。

特定のブラウザを選ぶ必要がないのは、そこが収益化の場所であり、縛るべきではない、と考えたからです。アプリストアを自由にしたのも、そこを通過する際に税金のようなものを支払うのは、イノベーションを阻害すると考えたからです。独自のフォーマットで立ち往生する必要もありません。

基本的に、世界はより良い場所になると信じています。エコシステムは、誰にとっても良い、より健全な場所であるべきであり、そうすれば、多くの技術革新が生まれるはずです。

いまだ進歩の過程にあり、市場開発段階にあるHoloLensのような存在にとって、開発者は重要な存在だ。そのためHoloLens 2では、「月に99ドル」で使える開発者版が用意される。ハードウエアを買い切りにすると3500ドルだが、より安価に開発を始めることができる。日本での価格はまだ未定だが、発売は決まっている。

キップマン:まだ日本での価格は公表できませんが、出荷の一日目から、日本でも使えることを確約します。月額制の支払いモデルも日本で提供します。

なぜそうするかって? その方が開発者にとっていいことだと思うからです。ハードウエアを買う余裕がある開発者は購入を選んでもいいですし、サブスクリプション形式で使い続けていただいてもかまいません。開発者コミュニティに対してなにができるか、という意味で、姿勢を明確にできたものの一つが「開発者向けの低価格サブスクリプション版」なのです。

西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、週刊朝日、AERA、週刊東洋経済、GetNavi、デジモノステーションなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。
 近著に、「顧客を売り場へ直送する」「漂流するソニーのDNAプレイステーションで世界と戦った男たち」(講談社)、「電子書籍革命の真実未来の本 本のミライ」(エンターブレイン)、「ソニーとアップル」(朝日新聞出版)、「スマートテレビ」(KADOKAWA)などがある。
 メールマガジン「小寺・西田の『マンデーランチビュッフェ』」を小寺信良氏と共同で配信中。 Twitterは@mnishi41