ニュース

オンキヨーとドコモ、“身に着ける”音声対話型AIエージェント実現へ

オンキヨーは18日、ネックバンド型のウェアラブルデバイスを使った「Onkyo AI」のビジネス向け事業を本格的に開始したことを発表。NTTドコモが持つ「ドコモAIエージェントAPI」を組み合わせた活用例を紹介した。

Onkyo AI採用ウェアラブル端末の装着例

「onkyo AI」は、オンキヨーがAIそのものを開発するのではなく、これまでGoogleアシスタントやAmazon Alexa対応のスマートスピーカーを製品化している同社が、サービス提供者や想定ユーザーなどに適したAIアシスタント機能を選択して、製品やサービスを開発する取り組み。今回はドコモのAIエージェントを活用した事例が紹介された。

展示されたウェアラブル端末の試作機。スピーカーやマイクを内蔵

披露されたウェアラブルデバイス試作機はネックバンド型で、スピーカーやマイクを内蔵。耳を塞がず、装着している本人によく聞こえるように音声を出すことで、周囲とのコミュニケーションを妨げずに音声アシスタント機能が利用できる。例えば百貨店で買い物する場合に、店舗内を案内するコンシェルジュのような役割をしたり、受付業務の会話内容をハンズフリーで文字として記録、工場などで音声を活用して作業を支援するといった利用が想定される。

主な使用イメージ

オンキヨーは、この端末を使用して簡単にAIアプリケーションを活用できるシステム提案を、OEM事業の一環として各企業へ提案する活動を開始した。

今回はデモンストレーションとして、ドコモAI エージェントAPIを用いて開発した「お買いもの支援アプリ」を紹介。店舗内でウェアラブル端末を受け取り、装着すると、その時開催しているイベントや、タイムセールなどの情報を音声で案内。昼になると「レストランを案内しましょうか?」と尋ねてくるので「はい」と答えると、「和食の〇〇(店名)はいかがですか?」などとおすすめが案内され、「お願い」と答えると、その店があるフロアなどを教えてくれた。位置ビーコンを活用し、客がいる場所に応じて情報を案内する仕組みも考えられるという。AIだけでカバーできない部分は、オペレーターにつなぐなどのフォローも行なう。

百貨店などでの音声案内に返答

医者が利用する場合は、患者と話した内容を自動で書き残すため、対話だけに集中できて、コミュニケーションを円滑にするという。また、日本語を話せない外国人労働者に、作業内容を英語で説明するといった用途も提案している。

ハンズフリー&音声入力
作業を中断せずに操作

スマートスピーカーなどの技術をビジネス展開へ

オンキヨーのB2B本部 AI・IoT事業推進室 宮崎武雄室長は、同社が1月の「CES 2018」でAI活用のウェアラブル端末「VC-NX01(仮称)」を参考出展した時に、来場者から業務用で使いたいという提案が寄せられたことなどを受け、本格的にビジネス展開を開始。

オンキヨー B2B本部 AI・IoT事業推進室 宮崎武雄室長

会社の人手不足や業務効率改善などが話題になる中、外国人労働者や高齢者などが働きやすい環境を作るためのAI活用を見込んでおり、インカムのような長時間装着するストレスが無くハンズフリーなネックバンド型端末により使いやすさを追求したことを紹介した。

同社はAlexaやGoogleアシスタント対応のスマートスピーカーを昨年製品化したことなどで、マイク技術に関するノウハウも蓄積。騒音が多い中でも正確に聞き取るためのマイクアレイを使ったビームフォーミング技術や、不要な帯域のノイズを減らすノイズサプレッション、自己再生音を消すエコーキャンセル機能など、スマートスピーカーに求められる機能と、アンプやスピーカーなどのデバイス部分をチューニングして搭載できることを訴求。「各AIの特徴に合わせて、ハードウェアをチューニングして、量産化できるのが強み」とした。

スマートスピーカーなどで培ったマイク技術を活用
オンキヨーが目指すウェアラブル端末

これまでオンキヨーはスマートスピーカーや、Siri対応イヤフォンなどコンシューマー向け製品が中心だったが、今後はBtoBへ拡大。これまで「しゃべってコンシェル」で日本語の対話型サービスに関する実績も持っているドコモのAIエージェントAPIを活用することで、ビジネス向け展開の加速を図る。

なお、今回の端末を使ったサービスの提供時期については「作り込みが案件によって異なる」として具体的には示されなかったが、Wi-Fi、LTE、Bluetoothどの通信方法を使うのかなど、各パートナーに最適な方式を選択してサービスの実現を目指すという。

NTTドコモのAIエージェント部隊「AI Geeks」が支援

NTTドコモが2017年6月に発表した「ドコモAIエージェントAPI」は、新たなAIエージェントを構築したい企業などに向けて提供する基本システム。NTTグループのAI「corevo」に含まれる先読みエンジンと多目的対話エンジン、IoTアクセス制御エンジンの3つのエンジンで構成する。

ドコモAIエージェントAPIを採用

主な特徴は「自由度の高い対話設計」、「様々な音声合成モデル」、「高い音声認識性能」、「多種多様な端末への対応」の4つ。音声合成については、声優などが4時間収録することで1つのモデルを作成でき、音声認識については、ただ聞き取るだけでなく、何を言っているか文脈で捉えることも可能だという。デバイス対応については、iOSやAndroid、Unityなどに対応するSDKを用意している。

ドコモは、同社AIエージェント基盤を活用して、以前の「しゃべってコンシェル」を引き継ぐ新たなAIエージェントアプリ/サービス「my daiz(マイデイズ)」を2018年5月よりコンシューマー向けに開始した。企業向け(B2B2X)には、2019年春にサービスを提供予定。現在はトライアル基盤を提供している。家電操作アプリや、対話サービスなどの実現を目指しており、今回のオンキヨーによるウェアラブル端末活用も、このビジネス向けサービスの1つとして進められている。

ドコモAIエージェントAPIの活用例

NTTドコモのイノベーション統括部 クラウドソリューション担当 秋永和計担当課長は、同社に「AI Geeks」という音声対話ソリューション専門部隊がいることを紹介。パートナー企業の意向に応じて製品やソリューションを共同開発するという。秋永氏によれば「AIは、会社や産業に合わせた一点モノが多い」とのことで、建設や食品などパートナーの産業に合ったシステムインテグレーターとのマッチングなどまで、ドコモがサポートするという。

NTTドコモ イノベーション統括部 クラウドソリューション担当 秋永和計担当課長
専門部隊の「AI Geeks」
ドコモAIエージェントAPIの一般商用利用などのスケジュール