|
株式会社日立製作所は17日、映像に付けられたテロップの文字を90%以上の精度で読み取れるという自動認識技術を発表した。文字データへの自動変換も行なえ、映像コンテンツの中から見たいシーンをキーワードで見つけ出す、次世代映像検索のベースになるとしている。 ネットワーク経由で視聴できる映像コンテンツの増加などにより、膨大な映像データの中から、目的のシーンを素早く検索できる機能へのニーズが高まっている。しかし、人間の手で、シーンごとにキーワードを付与するには手間がかかる。 また、映像内で使われているテロップを文字として認識しようとしても、テロップには複数行で構成されているものや、白文字と黒文字が同一行で使われているもの、明暗が反転しているなど、様々な形状やデザインがあり、実用的な読み出し精度が得られていなかった。 【テロップから文字列を抽出する流れ】
さらに、(3)において、そこが文字であるか、背景であるかを判断するアルゴリズムも開発。「明るい背景に暗い文字」と、「暗い背景に明るい文字」が1つのテロップ内に混在しても、文字を正しく抽出できるとしている。
評価実験の結果、90%以上の精度を確認。抽出したテロップを文字データに自動変換し、キーワード登録することで「テロップを用いた映像検索の実現に向けた見通しが得られた」という。同技術の応用により、1つの映像の中から目的のシーンを見つけるだけでなく、多数のコンテンツから横断的にシーンを検索したり、含まれるキーワードを抜き出すことで、再生せずにコンテンツの概要を把握できるようになるとしている。
□日立のホームページ
(2008年3月17日) [AV Watch編集部/yamaza-k@impress.co.jp]
Copyright (c)2008 Impress Watch Corporation, an Impress Group company. All rights reserved. |
|