西田宗千佳のRandomTracking

第614回

生成AI時代の“アレクサ+”登場。「完全新規設計」の姿とは

発表会はニューヨークで開催された

2月26日(米国東部時間)、米Amazonは音声アシスタントであるAlexaの新バージョンである「Alexa+」(アレクサプラス)を発表した。アメリカでは来月からサービスが始まるが、日本など他の国での展開時期は未定。しかし、展開の用意は進んでいるという。

すでに第一報は以下のとおり記事化されているが、ニューヨーク現地から、様々なデモンストレーションの内容を含めた速報をお送りする。

なお、Alexa+の構造を含めた詳細については、別途キーパーソンへのインタビュー記事を掲載すべく準備中だ。そちらは少々お待ちいただきたい。

技術基盤の変化でAlexaが変わる

「我々は常に現実的な問題を解決しようとしている」

米Amazonのアンディ・ジャシーCEOは、発表会の冒頭に登壇し、そう述べた。

米Amazonのアンディ・ジャシーCEO

同社は25年以上にわたってAIを使ってきたが、その核にあるのは、配送から管理、カスタマーサポートまで、多くの企業や顧客の「困りごと」の解決だ。ジャジーCEOは以前、Amazonのウェブサービス部門であるAWS(Amazon Web Services)のトップだったが、まるで当時のイベントかと考えてしまうくらい、「AIという基盤がどのように企業に有用か」をまず語った。

AIを効率化する半導体を紹介するなど、まるでAWSのイベントであるかのような話からスタート

その理由は、技術基盤の変化がサービス自体を大きく変えてしまうからであり、本日の主題である「Alexa+」が、Amazonの作ったAI基盤を使い、「今の生成AIの技術」で作り直されたものであるからだ。

Amazonの中で「技術の変化がもたらした様々なサービス」を紹介、その最新版がAlexa+ということに

次に登壇したのが、Amazon Device & Services担当シニア・バイスプレジデントのパノス・パネイ氏だ。

米Amazon Device & Services担当シニア・バイスプレジデントのパノス・パネイ氏

彼はマイクロソフトで長くハードウエアビジネスを率いてきた人物で、「Surfaceの父」として記憶している方もいるのではないだろうか。彼は2023年秋にAmazonに移り、今はAmazonのハードウエアの顔となっている。

「Alexaは10年前に誕生し、劇的に生活を変えました。以来何億人もの人々が、6億を超えるデバイスでAlexaを使っています。そして、2024年にはAlexaが、前年に比べ20%も多く使われるようになっています」

そう言って紹介したのが「Alexa+」だ。

「これは完全に作り直された、次世代のAlexaです。非常に自然に会話できます。もう『Alexaのための話し方』をする必要はありません」

Alexa+の特徴を説明しつつ、パネイ氏自身がライブでデモを行なった
「Alexa+」のコンセプトビデオ

デモを見れば、たしかにその通りなのが分かる。英語ではあるが、普通の「会話」でどんどん物事が進んでいく。

パネイ氏は最初のデモで、「今日は250人も聴衆がいて、ちょっと緊張しているんだ」とAlexa+に語った。すると「ちょっと緊張するのは当然ですよ」と、まったく普通に会話が続く。

これが会話だけの話であれば、ChatGPTなど、最新の生成AIベースのチャットシステムと同じような感じである。「スムーズである」というだけでは、そろそろ驚かない。

だがAlexa+の重要な点は「自分のことも、周囲のことも知っていて、実際に必要な行動を起こせる」と言うことだ。

近くのピザレストランのお勧めを聞く、ということもできるが、同時に家族や自分の食事の好みを覚えておいてもらい、それに合わせてディナーの予約もできる。

「Alexa+」を使い、ピザレストランのお勧めを聞くデモ。内容がふんわりとしかわからないことへの対応も可能だ

「ブラッドリー・クーパーが、誰かとデュエットしてる曲はなんだっけ?」

と聞くと、Alexa+はちゃんとそれが「レディー・ガガとのデュエット曲である『Shallow』である」と答えてくれる。映画『アリー/ スター誕生』の挿入歌だ。

音楽が検索されてちゃんと再生されるのは当然だが、そこからさらに、映画の中で「Shallow」を歌っているシーンを再生してくれたりもする。

曲名までは覚えていない挿入歌を探してもらい、音楽サービスや動画配信で再生させることも

野球についてAlexa+と語り合って、選手がどんな経歴でどんな活躍をしたかを話しつつ、試合を予約することも可能だ。

アメリカのチケット販売サービス「Ticket Master」はダイナミックプライシングなので、値段も変わる。高すぎると思ったら、「200ドルになったら教えて」と指示しておくと、その値段が来た時に教えてくれるようにもなっている。

チャットでAlexa+と野球談義をし、その後にチケットが「200ドルになったら教えて」と指示

スマートホーム連携もできる。

セキュリティカメラの「Ring」には、記録した動画になにが含まれるのかを認識する機能がある。だが、それをちゃんと使っている人は意外と少ない。

そこでAlexa+と連動すると、「犬と散歩しているのが写っている動画」とか、「Amazonの配送がいくつ届いたか」を映像から確認するとか、そういったことを簡単に確認できたりもする。

「Alexa+」を使い、数日前に犬と散歩している人が写った動画を検索するデモ

Alexaは自分のアカウントに紐付いて多数の情報を記録している。さらに、そこに自分に来たメールやPDFを読み込ませて活かすことも可能だ。

例えば「自宅に太陽電池を付けられるか」について、単に自宅の状況からだけではなく、住んでいる地域の規制やルールを参照した上で「家の周囲のどこに付けられるか」を返答して来る。

もっとパーソナルな話として、子どもが参加するサッカーの試合をカレンダーに登録し、「スナックをもっていくことを忘れないように」とリマインダーも設定できる。

今までのAlexaは、「コマンドワード」を話し、リモコンの代わりに声を使うようなイメージだった。だがここまでの例でおわかりのように、「普通に会話してやってもらう」感じに変わる。

これはたしかに、劇的な変化と言えるだろう。

生成AIが「レシピのカスタマイズ」や「ウェブとの連携」も

会見後にはデモも用意されており、そこでさらに興味深い体験ができた。

Alexa搭載デバイスの中でもディスプレイ付きのデバイスの場合、レシピを聞いて料理を作る時に使う……という例は人気がある。

Alexa+でも対話しながらレシピを探せるわけだが、さらに大きな変化もある。

レシピが示す素材の中で、自分が持っていない調味料があったとする。例えば(アメリカなので)醤油がない、としよう。特定の食材が苦手、というパターンでもいい。Alexa+に「醤油がないので代替手段はない?」と聞くと、ちゃんと同じような料理で醤油を使わないソースのレシピに変えて教えてくれる。

さらに、そのレシピで使う食材をまとめてそのままオンラインで購入し、家に届けてくれるよう頼むこともできる。

前出の「値下がりまで待って通知してもらう」パターンだと、テニスラケットを探してもらい、それがセールになったら教えてもらう……という形もできる。

家を本格的に、専門業者に頼んで掃除してもらうとしよう。Alexaは自宅の部屋数などを知っているので、それを配慮して業者に依頼してくれる。その際、まず複数の業者をリストアップしてくれるが、さらにその中から「オーガニック素材の洗剤などを使っているところ」といった条件をつけて事業者を選べる。

ポイントは、ここで出てきた事業者はAlexaのための特別なサイトやAPIを使っていたわけではない、ということ。普通のウェブサイトを検索して見つけて、さらにそれをAlexa+が扱える形にし、自然な形で使っているということだ。

Alexaはスマートホームでもよく使われているが、複数の動作を連携させる“ルーチン”の設定は面倒だ。それも音声で「こんな内容のものを」としゃべれば、自動的にルーチンを作ってもくれる。だからかなり簡単になる。

サービススタート時には間に合わないが、テレビなどとの連携もある。「○○というシチュエーションが出てくる映画は?」といった感じで作品を探してもらったり、「Shallow」の例のように音楽を捜してもらったりもできる。

ここで重要なのは、そうした検索的な使い方が「Amazonのサービスでだけ可能、という話ではない」という点だ。デフォルトでどのサービスを使うかを指定しておけば、SpotifyでもApple Musicでもいい。

ネットに多数ある情報と各種サービスとの連携をAlexa+が受け持つ仕組みなので、Amazonのサービスに特化する必要がないのだ。

互換性を維持したままサービスを新生

これらのことから、Alexa+の性質がかなり見えてくる。

AmazonはAlexa+を「完全に作り直したもの」としている。いわゆる生成AIベースになっているので、コマンドワード的な挙動から自然な会話になるのは、まあ理解できる。

一方重要なのは、これらのサービス例は「多数のウェブサービスや周辺機器と連携しなければ実現できない」ということだ。過去ならはそのために「専用SDKを用意して、デベロッパーに新しいものを作ってもらう」というアプローチが必要になった。

しかしAlexa+はそうではない。

過去のAlexa Skillや周辺機器はほぼそのまま使えて、Amazonによれば「何万もの(tens of thousands)」Alexa対応機器とサービスが対応しているという。Alexaとしての情報のやりとりはそのままに、人間とのインタラクションがAlexa+でリッチになった、ということだ。

すでにある何万ものスキルや対応機器がそのままAlexa+で使える

多数のメディアと情報収集の面で提携しており、その結果として、非常に物知りになっている。

Alexa+のメディアパートナー。多数の公式情報をつかって間違いの少ない回答を目指す

そして前出のように、サービスや店舗、商品を比較するなどの場合、特にAlexa対応ではないところも、普通のウェブから情報をひっぱってきてまとめる。

この部分は過去のAlexaというよりも、ChatGPTやPerplexityのようなAIサービスに似ている。

その上で、音声や画面UIはあくまでAlexa。ほとんどの要素がクラウドベースなので、以前の製品にも対応するし、今までどおりスマホアプリでも使える。

さらに、新たに「Alexa.com」というウェブサイトが整理され、PCからもほとんどの機能を自由に使える。この辺はChatGPTなどの影響を感じるが、本質はあくまで「スマホアプリなどでできていたことをブラウザにも拡大する」というスタンスだ。

Alexaに生成AIをくっつけたのではなく、文字通り「生成AIをベースにAlexaを作った」という構造なのだ。

プライム会員なら追加料金はなし、日本語対応の予定も

現状Alexa+は、3月からアメリカでスタートする。対応言語はアメリカ英語で、アカウントや位置情報も「アメリカ」である必要がある。いわゆるローリングローンチ方式なのだが、「Amazon Primeの会員で、特定のデバイスを持っている人」だと早めに機能開放が回ってくる形式のようだ。

生成AIの推論には演算コストがかかるためか、Alexa+の利用には月20ドルがかかる。しかし、Amazon Prime会員であれば追加費用はない。

日本での対応時期は未公表だが、対応自体はほぼ確実で、あとはどのくらい時間がかかるか……というところだろう。

今回、新製品ハードウエアは一切発表されず。完全にサービスのみの展開となった。

だがAmazonは「あらゆるAlexaデバイスで使う」としており、今後もハードウエア展開は拡大されそうだ。

Alexaはあらゆるところにいつでも。この考え方で「Alexa+世代」のハードも、今後出てくるのだろう

その中で、どのような「Alexa+」世代ハードが出てくるかは、今年後半のお楽しみ……というところではないだろうか。

個人的な印象をいえば、ディスプレイ付きのAlexaデバイスがさらに中心になっていきそうな感じなのだが……。

西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、AERA、週刊東洋経済、週刊現代、GetNavi、モノマガジンなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。 近著に、「生成AIの核心」 (NHK出版新書)、「メタバース×ビジネス革命」( SBクリエイティブ)、「デジタルトランスフォーメーションで何が起きるのか」(講談社)などがある。
 メールマガジン「小寺・西田の『マンデーランチビュッフェ』」を小寺信良氏と共同で配信中。 Xは@mnishi41