ニュース

パナソニック、AI活用の文字起こしサービス「P-VoT」。番組制作向け

パナソニック システムソリューションズ ジャパンは、音声処理・音声認識技術を活用した文字起こしサービス「P-VoT(ピーボット)」のベータ版サービスを、6月13日から放送業界向けに提供開始する。ベータ版のサービス料金は無償。2019年度内に正式商用サービス開始予定で、製品版では有償化する。

P-VoT(ピーボット)の概要

パナソニックが放送業界で培ってきたシステム技術、映像/音声処理技術を活用し、報道現場をはじめとした放送コンテンツ制作における、放送原稿制作業務の効率化・サポートするサービス。

記者は動画・音声ファイルをパナソニッククラウドサービスにアップロード、制作現場からの戻りを待つことなく修正・編集することが可能となる。ウェブブラウザでのリクエスト(アップロード)から、テキストの修正作業まで行なえ、取材動画・音声からの原稿テキスト作成の高速化・効率化を実現するという。

サービスの特長として、多層のニューラルネットワーク(Deep Neural network: DNN)技術を用いた高精度音声認識により、幅広いジャンルの文字起こしに対応。

編集画面では文字をクリックすると、文字起こしした音声の位置から頭出しプレビュー再生を開始。再生中はプレビュー動画/音声に追従して音声認識結果にマーキングする。映像・音声から発声位置を探しだす作業もクリックひとつで、効率的な文字起こしの編集作業が行なえるという。

グループデータ管理により複数人での修正・編集にも対応。現場担当者がリクエスト(アップロード)、事務所での修正・編集担当者が認識結果を確認・編集できる。認識の完了・結果の通知は登録されたユーザーのみに通知され、担当者間による個別メールでの送付がないため、利便性と安全性を兼ね備えた情報管理・運用が可能とする。

将来的には、パナソニックの製品と連携することで、運用ワークフローとシームレスな連携を予定している。

放送業界においては、事件、事故、災害など報道現場の速報性や正確性が求められている一方で、業界における「働き方の改革」が課題となっている。パナソニックでは、P-VoTによって番組原稿作成業務のワークフローが40%効率化すると想定。働き方改革に貢献するとしている。