西田宗千佳のRandomTracking

第412回

サービスとハード両面で進む次世代Amazon Alexa戦略。ささやき・クルマ・音質・文脈

米Amazon.com本社で、音声アシスタント「Alexa」に対応した多数の新製品やAlexaの戦略が発表された。スマートスピーカーやFire TVからクルマ、電子レンジまで様々な領域にAlexaを広げていく。製品については、速報記事で紹介しているが、ここでは、発表会後に開かれたハンズオンセッションや担当者からの説明セッションで判明したことも含め、Alexaのこれからの戦略にフォーカスした説明をしていく。

発表会場の「The Sphere」。アメリカの記者が中心だが、ドイツやオーストラリア、インド、日本からも記者が集まった

「ささやき声」や「文脈理解」も。ここから数カ月で進化するAlexa

発表会は、Alexaの進化についての紹介から始まった。

Alexa(アレクサ)と呼びかけて、音声対話により機能を呼び出す、という使い方が基本だが、毎回「Alexa」というのが面倒だ、という問題もある。そこで、Alexaが「比較的長期」の記憶を持ち、連続での応答に答えられるようになったり、ささやき声で語りかけると「小さなささやき声で返答」したりと、「これから数カ月以内」(Amazon Devices担当シニア・バイスプレジデントのデイブ・リンプ氏)に随時アップデートされていくという。日本語でも実現されるものがいくらかあるようだ。

Alexaに「ささやき声」モードが実装。ささやき声で話しかけると、ささやき声の声色と音量で反応してくれる。もう、寝ている子供が起きてしまうことはない

発表会後の説明セッションにおいて、Amazon Alexa担当 バイス・プレジデント 兼 サイエンティストのローヒット・プラサード氏は、「現在はボイス・ユーザーインターフェースへの進化が進んでいる最中。能力(competency)・文脈理解(context-aware)・知識(knowledgeable)・自然さ(Natural)・自己学習(Self-learn)の5点で改良を進めており、その成果のいくつかは、複数の言語に対し、数カ月内に反映される」と話す。

Amazon Alexa担当 バイス・プレジデント 兼 サイエンティストのローヒット・プラサード氏
Alexaを進化させる5つのポイントについて。能力(competency)・文脈理解(context-aware)・知識(knowledgeable)・自然さ(Natural)・自己学習(Self-learn)の5点で改良を進めている

例えば、現在のAlexaにおいては、多数存在する音声アプリの「Skill」が有効に活用されていない。Skillを呼び出すコマンドを、人が憶えていられないからだ。そのため今後は、Skillを示す「サービス名」が直接的に含まれていなくても、その人が登録しているアカウントや利用歴などから判断し、自動的に適切なSkillへと命令が引き継がれるようになる。「Alexa, Get me a car.」と命令した場合、なにも考慮しないと「車を買う」のか「タクシーなどを呼びたいのか」判断できないが、文脈や履歴などから理解することで、「Alexa, Get me a car.」と命令するだけで、「Uberを一台自宅に配車する」といった命令を伝えることが可能になるという。

Skillをより自然に使うための「Natural Skill Interaction」技術。文脈や利用履歴などを勘案し、「Skill名」を言わずとも命令が通じるようになる

これは、Alexaの使い勝手を高める努力であると同時に、Alexaの上に成立する「ビジネスエコシステム」をより確かなものにしたい、という発想の表れである。

Alexaはクラウド側で常に進化を続けている。その受け皿となるのが、今回発表されたハードウェア群だ。

「音楽」をリビングに取り戻したEcho。次の注力点は「音質」

ハードウェアとしてまず紹介されたのは、ベーシックなスマートスピーカーとしての「Echo」シリーズだ。発表を担当した、Amazon Devices担当シニア・バイスプレジデントのデイブ・リンプ氏は「Echoの発売によって、Amazon Musicへのアクセスは急増し、個別化していた音楽が“リビング”に戻ってきた」と話した。

リンプ氏は「ラジオ以来、音楽はリビングの中心にいたが、メディアの変化とともに個人的なものになっていた」と変遷を解説
2015年にEchoが一般販売されて以降、Amazon Musicへのアクセス数は急速に増加を続けている

事実、スマートスピーカーはストリーミング・ミュージックをリビングで聞くものとして広がった部分はあり、AmazonもAmazon Musicとの連携を打ち出していた。今回発表された製品は、みな「音質の強化」をひとつの軸にしているが、それも当然だろう。

機能的に大きく変わったのは、「マルチルームオーディオ」や「複数台連携」が基本機能になってきた点だ。例えば新しい「Echo Plus」は、2つ組み合わせることでステレオ再生に対応する。そして、さらに音質を向上させたい人のための商品として出てきたのが、ワイヤレスサブウーファーの「Echo Sub」だ。Echo SubはEchoとの連携専用の商品になっている。

新しいEcho Dotの中身。サイズも大型化し、スピーカーの音質が強化された
複数の部屋のEchoを連携させる「マルチルームオーディオ」。アメリカ市場のネットワークオーディオの基本機能となりつつある
ワイヤレスサブウーファーの「Echo Sub」。この製品の販売こそ、Echoの高音質化に対する欲求の表れといえる

ここからは日本では販売されないが、バリエーションはまだある。オーディオ機器を別途持っている人向けの製品だ。

ひとつめは、スピーカーを完全に外付けした「Echo Input」。スマートスピーカーは音声に認識のために高度なマイクシステムが必要なのだが、そことネットワークアクセス部分だけを切り出し、スピーカーとはBluetoothなどで接続することにした製品である。

「Echo Input」。スピーカーが外付けになるので非常にコンパクトになっている

そして2つめが「Echo Link」と「Echo Link Amp」だ。こちらは自宅にハイエンドオーディオ機器がある人向けの製品であり、背面にはオーディオ機器でお馴染みの端子類が並ぶ。ハイレゾオーディオにも対応している。この点は、今回、Alexaの音楽サービス用APIが改良・公開され、そのパートナーとして、ハイレゾストリーミングサービスの「TIDAL」が選ばれたことと、無関係ではないだろう。

Echo Subと、Echo Linkシリーズ。どちらも「高音質」へのアプローチである。
Alexaに対応している音楽サービス。日本の「dヒッツ(NTTドコモ)」と「うたパス(KDDI)」の名前も。Spotifyが入っているが、これはアメリカでのもので、日本のアカウントでは現状、対応していない
Alexaの新しいオーディオAPIを使い最適化したサービスとして、ハイレゾストリーミング・ミュージックの「TIDAL」を紹介。ここも「高音質」指向である

リンプ氏は「各家庭には様々な音楽環境があり、それに対応したい」と語った。「Echo Input」や「Echo Link」が製品化されたのは、そうした意図の表れだろう。この2つについては日本での発売予定が公開されていないが、特に大きな障害があるとも思えないので、AVファンとしては、ぜひ発売を検討して欲しいと思う。

スマートホーム設定から「フラストレーション」をなくす

今回の発表会において、音楽の次に示された大きな話題が「スマートホーム」だった。だが、ここで最初に提示されたのは「機能」ではない。「問題点」だ。

「現在のスマートホームは難しすぎる。ここを改善しなければ、新しい市場は生まれない。Amazonは問題点を解決することを考えている企業だ。過去に存在した、シュリンクラップの開けにくいパッケージを憶えているだろうか。あれを無くすため、私たちは“フラストレーションフリー・パッケージ”を作った。同じように、これから何年もかけ、“フラストレーションフリー・セットアップ”を実現する」

リンプ氏はそう語った。その第一弾として紹介されたのが「Wi-Fiのセットアップ」だ。

すでにAlexa対応の家電は多数あるが、その設定は簡単ではない。
Amazonが過去の開封しづらいパッケージを「フラストレーションフリー・パッケージ」にしたことを例示し、「スマートホームもそうなるべきだ」とリンプ氏は説明する
Amazonの狙う「フラストレーションフリー・セットアップ」の内容

今回アメリカで発売が決定している「Amazon Smart Plug」はそれに対応しており、非常にシンプルにセットアップが終わる。電源に差し込み、Alexaと話すだけだ。

発表会後の説明セッションでは、そのさらなる詳細が公開された。

例えば、現在照明機器をAlexaに登録する場合、「ハブの操作」「2つのアプリのインストール」「30以上のステップ」が必要になる。だが今後Amazonは、セットアッププロセスを見直すことで、これを「数ステップ以内」に減らそうとしている。

現在の「スマート照明」のセットアップ。手順が非常に多く、複雑になっている
Amazonは究極的に「電源を入れて使う」だけでセットアップが終わる世界を目指す。
実際にスマート電源タップの設定を行なった。QRコードをアプリで読み込み、電源につなぐだけでEchoとの通信が行なわれ、必要なセットアップが終了する

Wi-Fiのセットアップにはもちろん秘密がある。中核にあるのは「Amazon Wi-Fi Locker」というサービスだ。実はこれ、すでに日本でも導入されている。Fire TabletなどのAmazon製品を使う時、自宅のWi-Fi設定(SSIDとパスワード)を、Amazonの自分のクラウドに暗号化して保存するものだ。

・「Wi-FiパスワードをAmazonに保存する」機能に関する説明
https://www.amazon.co.jp/gp/help/customer/display.html?nodeId=201730860

Echoはここにアクセスし、一時的に「追加するデバイスとEchoだけのWi-Fiネットワーク」を作ってSSIDとパスワードを必要な機器に転送し、設定を終える。このプロセスが自動化・標準化されているので、「電源につないでAlexaに話しかけると設定が終わる」ように見えるのだ。

このセットアッププロセスと、製品に組み込むための技術情報は「無償公開」されるという。現在、TP-LINKとeeroがパートナーとして、先行でWi-Fiルーターなどへの搭載をテストしている。

数ドルの部品で家電を「Alexa対応」にする「Alexa Connect Kit」

そして、スマートホーム向けの施策として、「フラストレーションフリー・セットアップ」と同様に戦略的な取り組みが紹介された。

今回発表されたものの中で、アメリカでもっとも耳目を集めているのは「電子レンジ」だ。「AmazonBasics Microwave」は、電子レンジにWi-FiとAlexa搭載機器との連携機能を組み込んだものである。「Alexa、ポテトを蒸して」と言えば、自動的に電子レンジが動いてジャガイモが蒸し上がる。

「AmazonBasics Microwave」。Echoから声の命令で電子レンジが操作できる。実は「あらゆる家電のAlexa対応」のショーケースでもある

とはいうものの、正直、「AmazonBasics Microwave」はそんなに多機能なものではない。「AmazonBasics」とは、同社が販売する基本的でシンプル、低価格な家電製品群のこと。重要なのは、「AmazonBasicsとして売られるような、低価格でシンプルな電子レンジに対して、売価を変えることなくAlexa対応機能が搭載できている」という点である。別にAmazonは電子レンジを売りまくりたいわけではない。「こういう機能のものを、コスト負担なく搭載できる」ことをアピールしたいのだ。

そのキモとなるのが、「Alexa Connect Kit」という技術である。

Alexa Connect Kitは、ワイヤレスモジュールとAlexa関連尾処理を行なう半導体がセットになったものだ。アンテナまで含め、非常にコンパクトなモジュールになっているのだが、ここに家電機器をつなぐだけで、シンプルに「Alexa対応」ができる。コストはアナウンスされていないが、家電メーカーが組み込む際のコストは「数ドル以内」(Amazon関係者)だという。Alexa Connect Kitを組み込んだ家電を作りたいメーカーは、Amazon側にAlexa Connect Kitデバイスの利用料を支払い、最終製品に部品として組み込むことににある。

Alexa Connect Kitの開発ボード。中央のチップ部分こそが本体。Wi-FiとBluetoothを内蔵していながら、非常にコンパクトにできている。価格は「数ドル以内」。どうやら5ドルよりはずっと安いようだ

「AmazonBasics Microwave」の価格にも秘密がある。AmazonBasics Microwaveは59.99ドル。アメリカでの「安い電子レンジ」の価格帯そのものだ。すなわち、「普通の電子レンジの売価を大きく上げなくてもAlexa対応が十分に行える」というのが、AmazonBasics Microwaveに込められたAmazonのメッセージなのだ。

Alexa Connect Kitがコントロールするのは、「フラストレーションフリー・セットアップ」とAlexaのための家電を動かすこと。Amazonの分析によれば、「開発者が家電コントロールに求めているビルディング・ブロックは3つしかない」という。電源のオン・オフのような「トグル」、音量調整や温度調整のような「レンジコントロール」、そして、機器のモード変更をする「モード」だ。これらをうまく組み合わせれば、ほとんどの家電がコントロールできる。エアコンに「部屋の温度を24度に設定して」と命令するのも、ギターアンプに「ジミヘンと同じセッティングにして」と命令するのも、突き詰めて分解すれば「トグル」「レンジコントロール」「モード」の組み合わせなのだ。そして、Alexa Connect Kitはそれを家電に提供する。

発表会後には、Alexa Connect Kitを使って「ファンを回す」デモが行なわれた。声で「ファンを50%で回して」「ファンをフル回転して」といった命令を与える機能を搭載する際に必要となるコードの情報量は「300バイト」でいい。A4の紙一枚に満たないソースコードを書くだけで、Alexaでコントロールできるファンが出来上がってしまうのである。

Alexa Connect Kitを使って「ファンを回す」機器。非常にシンプルな構造だが、きちんとファンの回転数を「声で操作」できる
手にしているのは、Alexa Connect Kitでファンをコントロールする機器で使うソフトのソースコード。たった300バイトしかなく、A4一枚に収まる

Amazonは、Alexaによるエコシステムを構築する上で、スマートホームデバイスとSkillでのコントロールを重視している。その活性化のために、Alexa Connect Kitのようなデバイスを作り、ハードウェアベンダーの開発難易度を下げようとしているのである。

第2世代Echo Showは「動画」重視

今回発表されたもので、日本でも発売されるもののうち、もっとも大きな注目を集めているのは「Echo Show」ではないだろうか。Echo Showはアメリカなどでは発売済みであるものの、日本への市場投入は、今回の「第2世代設計」の製品まで待たねばならだかった。

日本でも発売される第2世代Echo Show。ディスプレイの改善もあり、動画関連機能が強化された

ただ、Echo Showに対する「新機能」としては、アメリカ向けのものが大きなインパクトをもっている。

AmazonはEcho Showやタブレットで「動画視聴」、特に「テレビ放送」を重視している。今回Echo Showと同時に発表になったデバイスに「Fire TV recast」という機器があるが、これはいわゆる「レコーダー」だ。ディスクへの書き出し機能はないが、ハードディスクに地上派やケーブルテレビの番組を録画し、宅内や宅外でスマホを介して視聴できる。

テレビ番組をEcho Showなどで楽しむための「Fire TV recast」。日本のレコーダーと同じものなのだが、録画文化のほとんどないアメリカで、しかもAmazonが大々的に展開するのは驚きだ

「まるで日本のレコーダーのようだ」と思う人もいそうだ。その通り、これは明らかに日本のレコーダーから影響を受けている。日本では録画番組などを宅内・宅外のネットワークを経由し、スマホで見る方法が定着している。Fire TV recastでは、日本のレコーダーと同じような手法を使い(ただし、完全に同じではないようだ。詳細不明)、どこでもテレビ番組を視聴可能にする。同じハードウェアの中には、Netflixや、ケーブルTV網をインターネットに配信する「PlayStation Vue」などを視聴する機能もあるため、事実上「放送と通信が融合した機器」ということになる。

こうした機能を重視した理由は、Echo Showのようなでデバイスについて、映像を視聴したい、いう声が広がっているからだ。Fire TV recastのコンテンツは、タブレットやスマホ、スマートTVからも視聴できる。そして、Alexaに対応するためのSDKとセットになって提供され、Lenovoのタブレットやソニーのテレビからも「Alexa Smart Screen SDK内蔵」ということで利用可能になるという。

ソニーのテレビが「Alexa Smart Screen SDK」に対応。Echo Show向けに作られたコンテンツの視聴やAlexaとの連携が可能になる

日本ではFire TV recastは発売予定がなく、直接関係がないものの、「録画」文化がほとんどないアメリカにおいて「どこでもコンテンツを見る手段」として「録画」に注目が集まる、というのは面白い現象だ。

監視カメラは「ご近所連携」「異常音検知」が特徴

もうひとつ、日本で発売されない製品の話をしたい。Amazonが買収し、製品ラインナップに組み込まれるようになった監視カメラ「Ring」のことだ。

Alexaと連携する監視カメラ「Ring」

Echo Showなど向けとして「Door Bell API」が用意された結果、Ringを使い、来客をインターフォンで管理する機能も可能になった。

ただ、より重要なのは「異常音検知」と「ご近所との連携」という2つの要素を持っている、ということだ。

Ringは周囲の音を聞き、異常につながる事を発見すること警告を発する。例えばガラスの割れる音や銃声、ドアを開けようとする音などだ。

スマートスピーカーでは、「Alexa、」のような「ウェイクワード」を待ち受け、ウェイクワードが聞こえるまで命令を認識しない(ネットにもアップしないでスルーする)という要素を持っている。そこでこの機能を応用し、「異常と思われる音」を認識し、利用者に伝えることができるようになっている。

また、動画・音などによる不審者情報はAmazonに集積され、「自宅の近所でRingとAlexaデバイスを導入している家で発見された警告すべき異常」を知れるようになる。知られたくない、プライバシーを守りたいという人もいるだろうが、一方で「コミュニティを安全・安心に保ちたい」という人々もいる。異常の発見や警告といった情報の共有によって地域が安全になるなら……という発想だろう。

Neighbors Appを使い、近所の「Ring」導入者が検知した異常も把握。地域全体に安全を広げる思想で開発されている

スマホとセット自動車を狙う「Echo Auto」

最後のデバイスが「自動車向け」だ。現在大手自動車メーカーの中では、AmazonやGoogle、LINEなどの音声アシスタント開発企業との提携が続いている。中でもAlexaは、アメリカでのシェアの大きさもあり、車載に向けた関係構築が進んでいる。

しかし、Alexaを使うために新車を買ってくれる人は限られている。そのため、今回発表されたのが「Echo Auto」である。サイズは驚くほど小さい。Apple TVやFire TVのリモコンより一回り大きい程度……というと、わかる人にはわかるはず。人差し指と中指、薬指を合わせたくらいの大きさしかない。この中に8つのマイクが入っており、自動車のロードノイズを削減しつつ、音声をはっきり認識する機能が盛り込まれている。

車に後付でAlexaを搭載するための「Echo Auto」。実は非常に小さく、ダッシュボードの上に置いていても邪魔にならない。
内部には8つのマイクが内蔵されており、ロードノイズなど、音声認識の妨げとなる音をうまく「キャンセル」して音声を拾い上げる

もちろん、Echo Autoだけで通信までできるわけではない。スマートフォンとの連携が必要だ。Bluetoothでスマートフォンと接続し、通信とGPSはスマートフォンの機能を使う。ナビゲーションなども声で行なえるが、その時には、スマホに入っている好きなマップアプリ(Google Mapsでもいいし、Apple Mapでもいい)が使えるという。

また、GPSの位置情報と連動し、「ルーチンワーク」を自動的にこなすこともできるという。例えば、家に帰ってきたら家の電気とエアコンをつける……といった連動だ。これももちろん、Alexaのスマートホームネットワーク機能を使う。

価格は49.99ドルと安い。だが、当面は一般販売ではなく、「招待者への販売」になる。招待販売の間は24.99ドルとさらに安い。Amazonは、製品の完成までに多人数でのチェックが必要と考える製品で「招待者への販売」という手法を採る。数千人・数万人規模のベータテストのようなものだ。自動車でのAlexaの利用はまだ少ないため、まずは使用状況を確認し、ソフトの完成度を上げたい……と考えているようだ。

日本ではこれも、残念ながら販売予定が立っていない。Echoがスタートした時と同じように、慎重に完成度を見定めながら、順番に開発をしていきたいのだろう。

スマホでカーナビが苦しくなった、と言われる。実際アメリカでは、日本以上に「後付型のカーナビ」市場がスマホに食われてしまっている。Echo Autoは、その流れをさらに加速することになるだろう。

西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、週刊朝日、AERA、週刊東洋経済、GetNavi、デジモノステーションなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。
 近著に、「顧客を売り場へ直送する」「漂流するソニーのDNAプレイステーションで世界と戦った男たち」(講談社)、「電子書籍革命の真実未来の本 本のミライ」(エンターブレイン)、「ソニーとアップル」(朝日新聞出版)、「スマートテレビ」(KADOKAWA)などがある。
 メールマガジン「小寺・西田の『金曜ランチビュッフェ』」を小寺信良氏と共同で配信中。 Twitterは@mnishi41