ニュース

YouTube、自動字幕付き動画が10億本を突破。機械学習の改善などで精度向上

 Googleは16日(米国時間)、YouTubeの自動字幕付き動画の数が、世界で10億本を超えたと発表した。自動字幕付き動画は、世界中で毎日1,500万回以上再生されているという。

自動字幕付き動画

 Googleは、2006年に初めて動画字幕機能を公開。その3年後から、自動字幕起こし機能も提供開始している。

 今後は、YouTubeで現在サポートされている、日本語を含む10言語すべてに自動字幕を拡大することを目指しており、「最終的には、すべての動画にシステムが生成した自動字幕トラックが作成され、クリエイターが内容の確認および編集を行う状況が理想」としている。YouTubeクリエイターなどに対し、自動字幕の設定方法などについて改めて案内している。

 同社は「YouTube動画の自動字幕起こし機能と Googleの自動音声認識(ASR)技術を組み合わせることで、字幕の可用性を拡大してきた。字幕に関する技術は今後も向上していく必要がある」との認識を示している。

 自動字幕の精度を向上させるためのカギとして「音声認識機能と機械学習アルゴリズムの改善」や、「トレーニングデータの拡大」を挙げており、これらの技術を同時に用いることで、英語自動字幕の性能は以前に比べて処理精度が約5割向上。「人の手で文字起こしを行った際にミスが発生する確率に徐々に近づいている」という。

以前(左)と現在(右)の自動字幕の比較
従来の自動字幕付き動画の例
現在の自動字幕付き動画の例