西田宗千佳のRandomTracking
'17年の本命はスマートスピーカー? CESを席巻したAmazon Echo&Google Homeを実機で分析
2017年1月19日 08:00
今年のCESの話題はなんだったか? AV Watch的にはOLED(有機EL)かもしれないが、会場全体で言えば圧倒的に「音声対応」。もっと言えば、Amazonの「Alexa」とGoogleの「Googleアシスタント」で、特にAlexaに席巻されていた、といっても過言ではない。
もちろん筆者も、こうした製品の存在はよく知っていたし、ちょっと試してみたこともあった。だが、正直、そこまで大きな市場になる、とは思っていなかった。
だが、その認識は正しくなかった。AlexaやGoogleアシスタントを使っている、俗に「スマートスピーカー」と呼ばれる製品群は、2016年後半に入って急速に市場を拡大し、一大勢力になっていたのだ。Business Insiderが昨年12月28日付の記事で伝えたところによれば、Amazonのスマートスピーカー「Echo」は、2015年に240万台、'16年には520万台が販売されたという。
Google Homeは2016年11月から販売を開始したところで数ははっきりしないが、販売が不調、という話は聞かなかった。北米でビジネスをする家電メーカー側の認識として、「家庭にはスマートスピーカーが普及しつつあり、連携する機能は求められて当然」という状況になってきているのだ。
ならば、そのスマートスピーカーが、実際にどのくらいのことができるのか、確かめてみなければならない。
今回、CES取材での渡米時に、Amazonの「Echo」シリーズのひとつである「Echo Dot」と「Google Home」を購入したので、そのテストをお届けしたい。
ただし、注意点がある。これらの機器はまだ日本語に対応しておらず、日本向けにも出荷されていない。「技適」((技術基準適合証明)も通っていない。なので、テストのすべてはアメリカ滞在中にホテルで行なっている。音声認識は全て英語で行ない、また連携する家電の準備が行なえなかったため、その辺りのテストは弱いことをご了承いただきたい。
どちらも低価格でコンパクト
まず商品の概要から。Amazon Echoには複数のラインナップがある。良いスピーカーを備えたフル機能の「Echo」、バッテリー内蔵で持ち歩きができる「Tap」、外部にスピーカーをつけて使うことを前提にした廉価版の「Echo Dot」の3種類がある。今回購入したのは最も安価な「Echo Dot」だ。
対してGoogle Homeは、フル機能版であるEchoの対抗馬で、カラーバリエーションはあるものの1モデル構成になっている。50ドルと130ドルということで、ボディサイズもパッケージングもかなり異なるものだ。
そもそも、EchoやGoogle Homeはアメリカの広いリビング全体をカバーし、音楽も良い音質で鳴らすことを想定しているので、背が高く、スピーカーの出力も大きい。それに対してEcho Dotは、個室にEchoの機能を配置することを想定した製品で、内蔵のスピーカーは最低限のもの。Bluetoothもしくは有線で、別途スピーカーをつなぐのが前提だ。
とはいえ、音声コマンドを待ち受けて対応する、という基本的な機能は、EchoもEcho Dotも変わらず、Google Homeと比較するには十分な性能を持っている。
含まれているのは、どちらも本体と電源、それに関連するケーブルのみだ。マニュアルはきわめてシンプル。なぜなら、セットアップはすべてスマートフォンアプリから行なうため、説明することがないからである。
本体はそれぞれ実にシンプルな作りだ。Echoにはいくつかボタンがあるが、使う際に押す必要があるのは音量調整くらいのものである。Google Homeは音量調整がタッチ式になっているので、ボタンは目立つところにはない。
どちらも「音声を聞くことを明示的に止める」ボタンが付いているのが、スマートスピーカーの性質をよく表している。
セットアップにはスマホとWi-Fiが必要、現状は「英語環境」が必須
ではセットアップをしていこう。
スマートスピーカーはWi-Fi(無線LAN)で通信を行なう仕組みになっている。だから、利用には当然Wi-Fi環境が必要。ほぼ常に通信している状況になるので、使うデータ量も多い。2つのスマートスピーカーをセットアップし、3、4時間利用する間に、なんと2GB以上のデータ量を使っていた。固定回線での利用が前提の機器である。通信速度自体は数Mbpsあれば問題ないようで、回線速度にセンシティブになる必要はない。
使い始めるためにWi-Fiをセットアップしないといけないのだが、これには、スマートフォンと連携するアプリを利用する。Wi-Fiのセットアップだけでなく、各種設定や機能の追加などにもスマホアプリを使うので、実質、スマホがないと使えない機器ということになる。スマホはiPhoneでもAndroidでも構わない。
ちなみに、Google Homeアプリはすでに日本のアプリストアにあるが、Amazon Echoのアプリはない。また、Google Homeアプリについても、セットアップを最後まで進めるには設定を英語に変える必要がある。そのため、今回はすべて筆者のアメリカ向けアカウントでテストをしている。
Google Homeが日本語化されているのは、もともとChromecastの設定に使うアプリだったからだろう。これは私見だが、Google HomeについてもGoogleアシスタントのセットアップまでは日本語で続くので、Googleアシスタントの日本語版が出れば、Google Homeは日本でも発売されそうだし、それほど先のことではなさそうだ。
一方、Echoのセットアップに使う「Alexa」アプリはまったく日本語化されていない。日本でのサービス開始への準備が、Googleの方が整っている、という印象を受ける。
セットアップの流れは両者共に非常に似ている。
まずは両者とも電源を入れる。そしてスマホアプリを立ち上げ、その指示に従ってEchoなりGoogle Homeなりを見つける。
Echoの場合には、出荷時状態ではそれ自身がWi-Fiのアクセスポイントになっているので、それをスマホから掴んで、さらにアプリ側で接続したい本物のアクセスポイントの情報を書き込む。一方Google Homeは、アクセスポイントの切り替えをせず、別の方法で周囲にあるセットアップ待ちのGoogle Homeを見つけ、そのあとにアクセスポイントの情報を書き込む、という手順だ。
どちらにしても、アクセスポイントの設定が終われば、自動的にサービスにつながり、最新のファームウエアや音声コミュニケーションに必要な情報などを取得、本体内に書き込む、というプロセスをとる。AmazonやGoogleのアカウントはアプリから登録する。
一度設定が終われば、もうあとはEchoなりGoogle Homeなりが独立して動作する。電源を入れたら、ずっと動き続ける。アプリが必要になるのは、後述するように「機能を追加する」時だけだ。
音声認識は驚くほど高精度、「部屋で気軽に使える」体験こそ本質
前置きが長くなったが、セットアップも終わったので、実際に動かしてみよう。どうなっているかは、それぞれ動画を見ていただくのが近道だ。音声が重要なので、音が聴ける環境でご覧いただきたい。
映像でお分かりのように、スマートスピーカーの役割は「音声コマンドに対して、音声情報や動作で返す」ことにある。ネットには天気など様々な情報があるから、それを聞けば答えてくれるのも道理だ。EchoもGoogle Homeも、GmailやGoogle Calendarと連携しているため、スケジュールやホテル・飛行機の予約情報を答えてもらうこともできる。
Echoの場合は別途Gmailとの連携設定を行なわないといけないが、Google Homeの場合、そもそもGmail、Google Calendarが自社サービスであるので、拒否しない限り自動的に連携する。
応答音声は自然だし、こちらの英語も、流暢でなくても大丈夫だ。筆者の英語はひどいものだが、それでも誤認識は少なかった。印象として、EchoよりGoogle Homeの方が優秀か……と思ったが、それも「どちらが上かと問われれば」というレベルであり、双方とも優秀、と言って間違いない。
でも、こう思う人もいるはずだ。
「すでに、スマホでは似たようなことができる。Siriだったら英語だけでなく日本語でもできる。それでいいんじゃないのか」
そう、その通りだ。ちょっと使うレベルで言えば、EchoやGoogle Homeはスマホでやっていることと変わらない。知識で判断すればそうなってしまう。筆者も去年までは同じような印象を持っていた。
だが、実際に使ってみると、その体験は大きく異なる。その軸となっているのは、「部屋のどこにいても使える」ということだ。
スマートフォンの音声対応はその性質上、スマートフォンが近くにないと使えない。だが、スマートスピーカーは優秀なマイクを備えている。だから、部屋のどこにいても、命令を口にすれば答えてくれる。部屋に置いてさえあれば、その部屋のどこにいても答えてくれる。
もちろん、ささやくような声ではさすがに無理だ。しかし、特別に声をはりあげる必要はなく、人に話しかける程度の大きさでいい。
例えば料理をしながら「明日の天気は?」「この後の予定は?」「明日の飛行機の時間は?」「元気になる曲をかけて」といった風に話しかければいい。「部屋のどこでも使える」のは、スマートフォンの音声対応とは違う気軽さがある。しかも、周囲で音楽がかかっていたり、テレビがついていたりしてもいい。多少声は大きめに出す必要はあるが、驚くほど普通に聞き取ってくれる。
命令を認識してもらうには「コマンドワード」が必要だ。これが、現在のスマートスピーカーやスマートフォンにおける音声対応の限界ではある。Echoの場合には「Alexa」、Google Homeの場合には「OK Google」と話しかける。
コマンドワードが単語ひとつである(しかも、それが人の名前に似ている)こともあり、「Alexa」の方が気楽で便利、と筆者は感じた。Amazonはうまいコマンドワードを見つけたものだ。Alexa、という名前の人はそんなにいないし、日常会話で頻出する言葉でもない。「Google」は日常よく口にする単語なので、頭に「OK」をつけないとコマンドワードにはならなかったのだろう。スタートレックでは「コンピュータ」というコマンドワードを使っているが、あれだと、今の技術では日常会話に出て来すぎるので大変だろう。
すなわち、スマートスピーカーがブレイクした理由は、「低価格である」「気楽に音声コマンドの価値を活用できる」ことにあり、スマホの音声対応技術のユーザー体験をルームスケールに拡大したことにある……といってもいいだろう。
実はスマホ、特にiPhoneでは「便利に気軽に音声コマンドを使う」方法はある。AirPodsを使うことだ。
AirPodsには、ダブルタップすることでコマンドワードなしにSiriを呼び出す、という機能がある。これだと、Bluetoothがつながっている限りは、AirPodsを「トントン」として喋るだけでいい。スマートスピーカーでできることの大半が、コマンドワードを使うよりも簡単に実現できる。他人のコマンドワードも混じらない。しかし、AirPodsは24時間つけているものではないし、スマートスピーカーのような開放感もない。それこそスタートレックのように、バッジ型のマイク(コミュニケーター)にでもならないと無理だろう。
やはりスマホでの音声対応とスマートスピーカーは、体験として「似て非なるもの」な部分が、今は存在する。
外部サービス連携で価値拡大、パートナーを広げるAmazon、テレビ連携のGoogle
そして、スマホ以上に便利であるポイントとして、「他のサービスや機器との連携が豊富」であることがある。
例えば音楽。
EchoもGoogle Homeも、ネット上の音楽サービスと連携する機能を持っている。Amazonは「Amazon Prime Music」を、Googleは「Google Play Music」を展開しているので、それらと連携するのが基本ではあるのだが、もちろん、Spotifyなど別のサービスでもいい。スマートスピーカーにリンクしておけば、それらのサービスを声で気楽に使える。
こうした使い方では、「特定のアルバムを聞く」のではなく、「プレイリストを聞く」「雰囲気に合わせて自動選曲してもらう」方がいい。アメリカでは音楽の楽しみ方の中心がストリーミング・ミュージックになっているが、スマートスピーカーは、確かにストリーミング・ミュージックが前提でないとなかなか成立しない。
Amazonがユニークなのは、音楽だけでなく「オーディオブック」も含む、というところだろう。これは自社で「Audible」という強いサービスを展開しているからでもある。だから「何々という本を読んで」という命令でもOKだ。
なお、Spotifyと連携する場合には、有料サービスである「プレミアムアカウント」に登録している必要がある。
このほか、音声でのニュースサービスやスポーツの結果告知などとも連携し、その場で知りたいことを教えてくれるようになっている。
どちらも、照明や鍵、暖房機器などのいわゆる「ネット連携家電」ともつながる。声でオンオフをしたり、設定を確認したりできる。この辺は、アップルがiOSにおいて「HomeKit」でやっていることとも近い。
だが、iOSのSiri、とスマートスピーカーの違いは、さらに広い「連携」の市場が広がっていることでもある。そして、Echo(Alexa)とGoogle Homeの違いも、この先の「連携」部分にある。
スマートスピーカーは、様々な機器・サービスとの連携を、ある種のプラグインの形で追加していけるようになっている。特にAlexaはここが強い。Alexaでは「Skill」と呼ばれているが、Amazonの中にSkillのマーケットプレイスができていて、有償・無償のSkillを自由にダウンロードして追加できるようになっている。今回は時間もなく、全てを試すことはできなかったが、スマホにおけるアプリストアのようなエコシステムができ始めていることこそ、Alexaの強みである。
Google Homeについても似たものはあり、「Googleアシスタントの追加サービス」として用意されている。だが、AlexaのSkillほどの活気はまだない。
一方で、AV的な視点では、よりGoogle Homeを魅力的に感じる部分もあった。それが「Chromecastとの連携」だ。
Chromecastでは、音声だけでなく映像も扱える。テレビにChromecastをつけたり、テレビ自体がChromecastの機能を内蔵していたりすると、それがさらにGoogle Homeと連携する。動画配信の映像や、Google Photosなどの写真サービスの静止画・動画を見ることも可能なのだ。
例えば、Google HomeにNetflixのアカウントをリンクしておくと、声で「スタートレックを見せて」と言えば、そこから連携設定したChromecastを動かし、テレビに映像を表示してくれる。
これは、Googleアシスタントの連携、ということもできる。先日Googleは、Android TVにGoogleアシスタントの機能を搭載する発表した。それは、こうした機能を広げていくための布石でもある。
先を走るAmazonとGoogle、プライバシー問題はどうなるか
今回、改めてスマートスピーカーを使ってみてわかったのは「気軽さの価値」だ。これが日本語で、色々な機器と連携して自由に使えたらどうだろう、と考えると楽しくなる。なにより、アメリカで注目されているのは、スマホと同じく「その上での経済圏」が出来上がりつつあるからなのだろう、とも感じる。
スマートスピーカーの本質は、「ハードはシンプル」であることだ。ほとんどの価値はクラウド側にある。だから、機器は安くなり、ハードはどんどん増える。クラウドプラットフォームがなければ展開できないため、ライバルも増えにくい。実際、Amazonは大きく先を走っており、Googleですら追いつくには相当の苦労がいるだろう。
同様の発想は、もちろん日本にもある。シャープは「AIoT」の掛け声で、2015年から同様のプラットフォームを作り、「安価なハードウエアでも音声対応を実現する仕組み」を整えつつある。だが、AmazonやGoogleの圧倒的な物量とエコシステムにどう対抗するのか、少々不安も感じる。対抗ではなく「連携」の方が与し易いかもしれない。日本ではソニーがGoogleとの連携を選んだし、今回CESでAlexaの姿が目立ったのは、Amazonとの連携を選んだ企業が多いことを示している。
Alexaの強みはやはり「対応機器の広さ」だ。アプリ名が「Alexa」であり「Echo」でないのも、「Alexa対応機器であれば、自社のものでなくてもいい」という懐の広さから来るものだ。
それに対してGoogle Homeは、スマートスピーカーとしてはGoogle Homeを中心に置き、テレビやスピーカーなど、関連周辺機器は他社連携で広げる、というスタイルに見える。
もちろん、今のスマートスピーカーは弱点だらけだ。
最大の制約は「コマンドワード」である。何かやるたびにコマンドワードをいうのは面倒でしょうがない。特に「OK Google」の二言が必要なGoogleは不利だ。
「OK Google、音楽をかけて」と言った後に音量を調整したくなった時、若干でも時間が空くともう一度「OK Google」と言ってから音量調整を命令しないといけない。これはいかにも面倒である。
その割には、機器がある場所で「コマンドワードが含まれる会話」がしづらいのが問題だったりする。ちょうど今回、ホテルでテスト中、AxelaやGoogle Homeの説明をしようとしたら、双方が同様に反応した。説明のために会話の中にコマンドワードが出てくるだけでも、スマートスピーカーは反応してしまうからだ。まあ、その後に命令を言わなければエラーで止まるだけなのだが。買い物などの命令には注意が必要だ。
なお、コマンドワードがあればスマートスピーカーは「必ず待ち受け状態」になる。コマンドワードで待ち受け状態になった後の音声は、記録され、解析のためにAmazonやGoogleへ送られていく。彼らの説明によれば、コマンド待ち受け状態でないときの情報は記録されていない。それでも気になるときのために「マイクをオフにするボタン」が用意されているのだろう。
アメリカでは、捜査当局が「殺人事件の現場にEchoがあったため、重要情報がないか、Amazonへ音声データの開示を求める」という事例も起きているという(ITmediaの記事)。現状、Amazonは開示を拒んだようだし、コマンドワードがなければ録音もされてはいないのだが、「スマートスピーカーとプライバシー」の問題は、確かにあるだろう。
どちらにしろ、スマートスピーカーの市場は、我々が思うより急速に拡大しつつある。日本のメーカー、そして日本の市場がどう対応するのか、検討する猶予はあまり残されていない。