ニュース

車やロボットが人の声に素早く反応。東芝「RECAIUS」音声認識のボイストリガー

 東芝デジタルソリューションズは、自動車やスマートスピーカー、ロボットなどの音声操作機能に活用できる「RECAIUS(リカイアス) 音声認識ミドルウェア ボイストリガー」を提供開始する。当初は日本語のみの対応で、2018年度に英語や中国語を含め他言語にも対応予定としている。

RECAIUS 音声認識ミドルウェア ボイストリガーの適応領域

 「RECAIUS 音声認識ミドルウェア ボイストリガー」は、音声操作などで特定のトリガーワード(音声アシスタント呼び出しや命令コマンド用のキーワード)を検出する組込み機器用のミドルウェア製品。例えば「ねえリカイアスくん、音量上げて」などと声をかけて操作する機能を実装可能にする。東芝コミュニケーションAI「RECAIUS」シリーズの1つとして展開し、スマートスピーカーや、ロボット、家電、車載機器などの分野・用途へ適用可能としている。

 機器側で音声アシスタントの起動や動作コマンド受付が可能。必要なメモリサイズは300KB程度で、計算量が小さいためトリガーワードに素早く反応するのが特徴。また、常に音声を聞いてトリガーワードを検出するため、押しボタン式のトークスイッチは不要。トリガーワードは希望する言葉を自由に設定可能となっている。

 キーワードに対応したボイストリガーの他にも、長文に対応した音声認識や省メモリで高品質な音声合成ミドルウェアのToSpeakなどの組込み機器用のミドルウェアを提供。高度な音声認識・合成・翻訳・対話・知識処理・画像認識などはクラウドサービス(WebAPIなど)で提供する。また、素早い音声/画像処理は端末側(ローカル側)で対応し、高度な処理はクラウドで行なうなど、ローカルとクラウドを活用したハイブリッドなパッケージサービスも提供可能としている。

 RECAIUSは、状況把握/作業報告の自動化などの「フィールド作業支援」や、リアルタイムでのオペレータ支援/記録業務の手間を削減する「コールセンター・コンタクトセンター支援」、今回発表したボイストリガーのような「IoT機器への組込み」の3つの領域に注力。単純な業務支援だけでなく業務の自動化に向けたサポートも実現するという。機器への組込みとクラウドとのシームレスな連携による新たなサービスの展開も推進する。

RECAIUS 音声認識ミドルウェア ボイストリガーの紹介動画