西田宗千佳のRandomTracking

第563回

Alexaに生成AI導入、Fire TVサウンドバー登場、Amazon秋の新製品詳報

アーリントンに作られたAmazon HQ2で発表。まだ一部が工事中という、できたばかりの拠点だ

9月20日(アメリカ東部時間)、Amazonはアメリカ・バージニア州アーリントンにある第二本社(Amazon HQ2)にて、新製品発表会を開催した。

すでに日本向けの製品についてはリリースと記事が掲載されているが、現地での発表の模様とハンズオンをお伝えしたい。

Amazonの発表はアメリカ向けのもので、基本的には英語での使用を前提としているし、日本国内では発表予定が見えないものもある。しかし、そのうちのいくつかは日本語化され、市場に投入されることになるだろう。将来を予測する意味でも注目しておいて損はない。

生成AIで「Alexaの理想」にまた一歩

「私たちはアンビエント・インテリジェンスについてのビジョンを堅持してきました。必要なときだけ現れ、常に背後であなたのために働いてくれる、そんなアシスタントが必要です。そして私たちは、そんな”人間を超えた”アシスタントを生み出す努力を、もう10年以上も続けています。生成AIによって、その夢は手の届くところまで来ました」

Amazonのデバイス&サービス部門 シニア・バイスプレジデントであり事業責任者であるデイブ・リンプ氏は、会見の冒頭でそう説明した。

Amazon デバイス&サービス部門 シニア・バイスプレジデントのデイブ・リンプ氏

リンプ氏は先日同職から退くことを発表しており、Amazonのデバイス&サービス部門のトップとして対外的にスピーチするのは、これが最後の仕事となる。「今日は個人としては、少々ほろ苦い日でもある」と笑いながら話していたが、長年取材で彼に会ってきた筆者としても少し寂しくはある。

一方で、彼が退くタイミングでついに「Alexaが目指していた理想」に一歩近づくと言うのは、少し感慨深い。

「我々は9年ほど前、家電業界における研究開発投資が、すべてスマートフォンに注がれていることに気づきました。年間数十億ドル規模の産業ですから、その流れは理解できます。しかし同時に、人生の大半を過ごす場所、自宅は事実上忘れられていました。だから私たちは、『Echo』に『Alexa』、『Fire TV』などに取り組んだのです」

リンプ氏はそう話す。こうしたデバイス、特にAlexaのような音声アシスタントを軸にしたテクノロジーの拡張として、家の中に存在するが表には見えないコンピュータ、「アンビエント・インテリジェンス」の開発が進められてきた。いわゆる「スマートホーム」ビジネスの誕生だ。

今回の新製品はそこで新たな技術を搭載し、家庭内での使い勝手をさらに上げようとするものが多かった。その中には生成AIを使った技術もあった……、と言うところだろうか。

独自LLM+独自データで進める「Alexa Chat」

AmazonがAlexaへの生成AI導入として打ち出したのが「Alexa Chat」だ。

Alexa Chatは、生成AIを使ってAlexaと会話する機能だ。

Alexaに生成AIを使ったチャット機能が登場。ただし当面は英語のみ

今までもAlexaとは会話はしてきた……と思うかもしれないが、こちらは今までのものとは少し違う。あえていうなら「多くの人がAlexaに抱いていたことを、ようやく実現させた機能」だ。

デモではこんなことが行なわれた。

まず、自分の好みのフットボールチームの試合結果を聞く。次に、お気に入りの選手の活躍状況を聞く。そこから友人を招いての観戦パーティーを企画し、さらに、そこで出すグリル料理の付け合わせについてアイデアを出してもらう。さらにはその日の天気状況を聞き、友人にメッセージで送っておく……。

Alexa Chatによる対話の一例

こうした一連のことを、自然な会話として行なうわけだ。1つ1つで「Alexa」と語りかけて命令するのではない。

現在であればChatGPTやBardなどで行まえるようになったことに近いが、こちらはもちろん音声である。また、自分の居住地やこれまでの対話による好みなども覚えていて、それを前提に話してくれる。

また、音声での対話が素早いのも特徴だ。

AmazonのHead Scientistであるローヒット・プラサード氏は「対話は快適であることが重要」として、次のような要素があることを明かす。

AmazonのHead Scientistであるローヒット・プラサード氏

「Alexaでは音声からテキストへ変換し、さらにテキストから音声へ変換し処理をするのではなく、音声から音声へ処理をすることで、中間のラグを減らしている」

また、Amazon Devices・インターナショナル担当のエリック・サーリーノ氏は、Alexa Chatでの生成AIの使い方について、こう説明している。

Amazon Devices・インターナショナル担当のエリック・サーリーノ氏

「私たちはAlexaを動かすために、さまざまな機械学習技術を利用しています。大規模言語モデル(LLM)もその一つです。使っているのは、我々独自の生成AIであり、LLMです。私たちの生成AIと他のLLMは異なっています。我々の技術は、生成AIに加え、知識について、データベースやナレッジグラフを活用しています。つまり、最も正確で信頼できるAIを提供するために、古いものと新しいものをブレンドしているようなものです」

それ以上の詳細は明かされなかったが、要は、Alexaのために利用者が提示した情報やこれまでの対話情報を、Alexaと対話する利用者のために活用し、対話の精度と価値を高めようとしているわけだ。

ここで気になるのは、日本語での利用がどうなるか、だろう。

現状は英語のみで、それも「数カ月以内にプレビューとして提供開始」ということになっている。おそらくは2024年に入ってからのサービス開始だ。

日本を含む他の言語にはそれから……ということになるので、それなりの時間がかかりそうだ。

ただ過去と異なり、Amazonは多言語化のためにTransformerベースの生成AIを使う技術も導入済みだ。それを全面的に使っていくことになるので、英語で安定動作してからの多言語対応は、過去よりも素早くなる可能性がある。

新Echo Show 8にもAIの力

もう一つ、今回新たに発表されたのが「Echo Show 8」の第3世代だ。アメリカでは予約が開始されたものの、日本での出荷予定などは公表されていない。しかし過去の経緯を考えると、数カ月くらいで日本でも販売されるのではないか、と予想できる。

ハンズオン会場では実機に触れることができた。過去のモデルに比べ、後ろ側がくびれた特徴的なデザインに変わっている。

第3世代Echo Show 8。カラーはホワイト
Echo Show 8のブラック。下についているスタンドは別売

Echo Show 8・第3世代では、過去のモデルに比べAI活用の幅が広がっている。

特に大きいのが「距離による表示の変化」だ。

Echo Showは家庭内に置かれるデバイスなので、PCやテレビと比べても、利用者との距離がバラバラだ。近くで使うこともあれば、比較的離れた場所から使うこともある。

そこで第3世代からは、搭載されたカメラを使って利用者との距離を測り、近い場合には詳細な情報を、遠い場合には読みやすさ優先のシンプルな情報を表示するようになった。

距離が変わるのに合わせて表示の密度も変化

カメラは「顔認証」にも使われる。顔認証による「ビジュアルID」で登録された人物と認識された場合、「Alexa」というコマンドワードを言わなくとも命令ができるようになる。

また、AIを使って設置空間に合わせたオーディオの最適化も行なう。空間オーディオ対応も含め、オーディオとしての利用状況が変わりそうだ。

空間オーディオに対応

ただし、ハンズオン会場では音の面をちゃんと聞き比べることが難しかったので、評価自体は保留としておく。

「スマート家電」管理向けに新デバイス導入

新製品として日本でも発売が決定しているのが「Echo Hub」だ。

家電コントロール用デバイスの「Echo Hub」

こちらももちろんAlexaも使うし、壁にかけて使うという意味では「Echo Show 15」に近いところがあるが、サーリーノ氏は「狙いが明確に異なる」と説明する。

「Echo hubは。画面をタッチして簡単にスマートホームを管理できることが特徴です。多くのスマートホームデバイスをお持ちのお客様向けに設計されています。私の場合、スマートホームデバイスの数は20台以上あると思いますが、少し前に数えきれなくなりました。こうした状況をより簡単に管理するために作ったものです。そして、他の家電コントローラーよりも安い。それに比べるとEcho Showは、コミュニケーションやエンターテインメントに向けたデバイス、ということになります」

確かに、数が増えると管理は難しくなる。どの部屋にどの機器があり、どうAlexaに呼べば使えるかを間違う可能性が高くなっていく。部屋ごと・フロアごとにちゃんと管理し、監視カメラも含めて使うなら、リビングかどこかに「コントローラー」を置きたくなる。

iPhone+LiDARで「ルームマップ」を生成

もちろん、そうした管理はスマホアプリで行なってもいい。Alexaアプリだ。Echo Hubのような機器も、Alexaアプリで管理している情報をベースにして、タッチ操作で使いやすくしているという側面がある。

では、スマホから管理自体を簡便化するにはどうしたらいいのか?

そこでAmazonが導入するのが「ルームマップ」だ。機能自体はAlexaアプリに搭載され、別アプリが用意されるわけではない。

ルームマップ。家の中でのスマート家電の位置もわかり、タップするだけでコントロール可能
使われるのはAlexaアプリ。別にアプリを用意することはない

スマホで部屋の画像を撮ってスキャンし、部屋の大きさやレイアウト、家具の配置などを取り込んで地図を作る。配置されているスマート家電は画面の下に「チップ」として置かれているので、実際の部屋の中の設置場所にドラッグ&ドロップしていく。それで完成だ。

スマホでルームスキャン。これにはiPhoneに搭載されたLiDARを使う

実はこの機能、使えるスマホが限られている。現状では、LiDARを搭載したiPhone、すなわちiPhoneの「Proシリーズ」を使う必要があるのだ。

アップルは「ARKit」というフレームワークを持っており、その中に、LiDARを使ったルームスキャン機能がある。これを使ってAlexaでのルームスキャンとホームマップ設定を行なっているわけだ。だから現状、iPhoneでしかこの機能は使えない……ということになる。

残念ながら、この機能は現状アメリカのみに提供され、他国への展開があるかどうかも開示されていない。

Fire TV Stickリニューアル、アメリカ向け新製品多数

AV関連機器も多く発表された。

日本でも発売されるものとしては、新しい「Fire TV Stick 4K」がある。

Fire TV Stickがリニューアル

ポイントは、性能アップとWi-Fi6Eへの対応。アートを表示して環境ディスプレイ的に使う「アンビエントディスプレイ」機能も搭載された。

日本での発売が決まっていない製品で注目なのは「Fire TV Soundbar」と「Echo Frames」だろう。

Fire TV Soundbar。日本での発売は未定

前者は119ドルという安価なサウンドバー。2チャンネル再生で、DTS Virtual:Xと、Dolby Audioに対応。HDMIと光入力も備える。価格重視のシンプルな製品、というところだろうか。

Echo Framesは、メガネフレーム型の音声デバイス。2019年にも初代モデルを発表しているが、今回は第2世代となる。

Echo Frames第2世代。バリエーションが大幅に増えた
筆者も青いフレームのものをかけてみた

カメラなどは搭載しないオーディオデバイスでAlexa連携、という狙いは変わっていないものの、マイク音質の改善やマルチポイント接続対応など、実用的な改善が目立つ。

フレームの種類がサングラスなどを含めた17に増え、選択の幅が広がったのも重要だ。もし日本で出るなら、買ってみたいと感じた製品だ。

子供向けの製品も各種発売。Fireタブレットについては日本でも展開される
西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、週刊朝日、AERA、週刊東洋経済、GetNavi、デジモノステーションなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。
 近著に、「顧客を売り場へ直送する」「漂流するソニーのDNAプレイステーションで世界と戦った男たち」(講談社)、「電子書籍革命の真実未来の本 本のミライ」(エンターブレイン)、「ソニーとアップル」(朝日新聞出版)、「スマートテレビ」(KADOKAWA)などがある。
 メールマガジン「小寺・西田の『マンデーランチビュッフェ』」を小寺信良氏と共同で配信中。 Twitterは@mnishi41