◇ 最新ニュース ◇
【11月30日】
【11月29日】
【11月28日】
【Watch記事検索】
日立、映像内のテロップを文字データに自動変換する技術
-テロップ文字からシーン検索が可能に


3月17日発表


 株式会社日立製作所は17日、映像に付けられたテロップの文字を90%以上の精度で読み取れるという自動認識技術を発表した。文字データへの自動変換も行なえ、映像コンテンツの中から見たいシーンをキーワードで見つけ出す、次世代映像検索のベースになるとしている。

 ネットワーク経由で視聴できる映像コンテンツの増加などにより、膨大な映像データの中から、目的のシーンを素早く検索できる機能へのニーズが高まっている。しかし、人間の手で、シーンごとにキーワードを付与するには手間がかかる。

 また、映像内で使われているテロップを文字として認識しようとしても、テロップには複数行で構成されているものや、白文字と黒文字が同一行で使われているもの、明暗が反転しているなど、様々な形状やデザインがあり、実用的な読み出し精度が得られていなかった。

 【テロップから文字列を抽出する流れ】

  • (1)映像からテロップ出現時刻とテロップ領域を検出
       ↓↓
  • (2)テロップ領域から文字列部分を抽出
       ↓↓
  • (3)文字列部分から各文字画像を抽出
 今回日立が発表したのは、(2)で使用する技術で、テロップ領域から文字ではない図形の部分を検出し、除去するための新アルゴリズムを開発。これにより、複数行にわたるテロップの中の文字部分を行ごとに抽出できるようになったという。

 さらに、(3)において、そこが文字であるか、背景であるかを判断するアルゴリズムも開発。「明るい背景に暗い文字」と、「暗い背景に明るい文字」が1つのテロップ内に混在しても、文字を正しく抽出できるとしている。

 評価実験の結果、90%以上の精度を確認。抽出したテロップを文字データに自動変換し、キーワード登録することで「テロップを用いた映像検索の実現に向けた見通しが得られた」という。同技術の応用により、1つの映像の中から目的のシーンを見つけるだけでなく、多数のコンテンツから横断的にシーンを検索したり、含まれるキーワードを抜き出すことで、再生せずにコンテンツの概要を把握できるようになるとしている。

□日立のホームページ
http://www.hitachi.co.jp/
□ニュースリリース
http://www.hitachi.co.jp/New/cnews/month/2008/03/0317.html

(2008年3月17日)

[AV Watch編集部/yamaza-k@impress.co.jp]


00
00  AV Watchホームページ  00
00

Copyright (c)2008 Impress Watch Corporation, an Impress Group company. All rights reserved.