ニュース

サッカー中継でシュートの音がクリアに。NTTが「ターゲットマイク技術」開発

 NTTは、サッカーのシュート音など、スポーツ中継時に特定の音声をクリアに抽出する音声処理ソフトウェア技術の「ターゲットマイク技術」を開発。これにより、テレビ放送などで臨場感のあるダイナミックな音が提供可能になるとしている。テレビ局などに対して、'15年度内にソフトウェア技術として販売。価格は明らかにしていないが、夏ごろまでには商用化できる状態になっているという。今後、東京オリンピックが行なわれる2020年に向けて、様々なパートナーとのコラボレーションなどを図る。

ターゲットマイク技術のデモ

 NTTは'14年7月以降、NHKと共同で実際のスポーツ大会などにおいてターゲットマイク技術を用いた競技音抽出実験を実施。サッカーのシュート音や、相撲の力士がぶつかり合う音、ゴルフのショット音/落下音、野球の打撃音を抽出し、これらの競技音を10~30dB(10~1,000倍)強調することを実現。より臨場感のあるダイナミックな音の出力が可能になることを実証したという。

 スポーツ中継において、既に映像ではカメラのズームによって狙った場所を高精細に撮影できるのに対し、これまで音声はガンマイクなどで集音しても、観客の歓声に埋もれて、視聴者が聞きたい臨場感ある競技音を届けるのが困難だった。今回のターゲットマイク技術により、これまで以上にスポーツのダイナミックな音を視聴者に届けられるとしている。従来のガンマイクでは不要な周囲の音声を6~10dB程度抑えられるのに対し、新技術では20~30dB下げられるという。

NHKとの実証実験内容
従来のスポーツ集音
ガンマイク利用時の課題

 具体的には、サッカーのゴール裏など、競技場に複数のマイクを組み合わせたマイクアレイを設置。その音にリアルタイムでソフトウェア処理を行ない、例えば場内の歓声と、サッカーのキック音、ゴールネットとボールが擦れる「パサッ」という音などをそれぞれ判別して、特定の周波数をカット/強調することで、歓声の音を抑えつつキック音を聞こえやすくすることなどが可能。競技など用途によって処理を変更できるが、特にサッカーはこれまで任意の音を取り出すことが難しいとされていたことから、効果は大きいという。このソフトウェア処理が使える範囲は、サッカースタジアムの場合はペナルティエリア内の10~20m程度としている。

ターゲットマイク技術のデモ映像

 NTTが'14年9月に発表した時点の技術では、空間情報を利用した分離により、例えば前方から届くキックの音を強調して後方からの歓声を抑えるといったことは可能だったが、前方からも届く歓声までは処理できなかった。今回の新技術では、音源の到来方向(空間情報)に加えて、各種競技音の特性(シュート音の立ち上がりの鋭さなど)を利用し、競技音をクリアに抽出する。鋭い立ち上がりを持つ音は、シュート音だけでなくゴルフのショットや相撲の張り手など幅広い用途に応用可能。音の空間情報と音源の時間的性質の双方を活用することで、2本程度のマイクでも、狙った音をクリアに抽出できるという。

ターゲットマイク技術の概要
複数のマイクを風防の中に設置するため、設置場所の制限も少ないという
デモで使われたマイク(手前)。風防の内部は明らかにしていない

 マイクアレイに使用する複数のマイクは2~4本。例えばサッカーのゴールの方向と観客の方向など、異なる向きに配置する。これらを1つの風防の中に収納して利用し、放送局などが持つ既存のマイクを使って集音できるという。今回の発表でマイクの具体的な向きなどの詳細は明らかにしていないが、実際に導入する際は、設置や録音方法などもNTTが説明する。ソフトウェア処理は、各マイクからの音を別トラックで適用するのではなく、ミックス後の音に行なうという。

 ソフトウェア処理はPCで行なう。遅延は15ms程度のため、30fps映像の場合は1フレームに満たない遅延で放送にも利用可能としている。リアルタイム処理だけでなく、収録後に音響エンジニアなどが特定の音を強調したり、歓声などのアンビエント音と組み合わせることで、映像と組み合わせてまるでピッチ内で聞いているような音響演出も可能としている。

 今回のターゲットマイク技術は、2月19日と20日に東京・NTT武蔵野研究開発センタで行なわれるNTT R&Dフォーラムにおいて一部結果を公開する予定。

選手の声なども抽出して臨場感を向上

 ターゲットマイク技術のデモとして、発表会場にサッカーのゴール裏を見立てた場所を再現。2本のマイクを組み合わせたマイクアレイで新技術を適用した後の音と、従来のガンマイクの音を比較した。実際に近いレベルの歓声をスピーカーで再現し、その中でシュートする時の音をソフトウェア処理後、再生した。

デモの内容
ゴールのネット裏に見立てた場所に、通常のガンマイク(右)と、ターゲットマイク技術を使用するマイクアレイ(左)を並べて設置
今回のデモで使われた機材
実際のスタジアムを想定し、周囲のスピーカーで95dB前後の歓声を再現して集音
ボールを蹴ってゴール
テレビ放送を想定し、デモの映像と音声を組み合わせて再生
上が通常のガンマイク、下がターゲットマイクの波形。ボールのキックとネットの音だけが強調して聞こえた
スペクトル比較

 開発を手掛けたNTTサービスイノベーション総合研究所 メディアインテリジェンス研究所の丹羽健太氏は、4月に発表した20m先の人の声をクリアに集音する「ズームアップマイク」の技術に対し、NHKから「スポーツで活用できないか」との提案があったことを説明。NTTとしては、「これまで通信に資する技術を中心に開発してきたが、放送クオリティに対応できるには、技術を向上させる必要があった」として、実証実験を行なうことになったという。

 今回のスポーツ向け以外にも、「欲しい音をクリアに集音したい」という需要は、遠隔会議で特定の話者の発言を拾ったり、車の中で騒音下での音声入力や、工場の機械騒音下で外部と連絡するといった用途があり、NTTはマイクアレイを使った集音技術の開発を進めている。'14年4月には、ハードウェア技術を中心としたターゲットマイク技術を発表しており、同9月には100dBの騒音下でも雑音を抑圧できる高騒音対応マイク技術の開発を発表している。

NTTサービスイノベーション総合研究所 メディアインテリジェンス研究所の丹羽健太氏
これまでの開発経緯
分離・抽出した競技音の利用方法

 今回のソフトウェア技術を用いた実証実験により、前述したサッカーのシュート音などのほか、周囲に道路があるゴルフ場で車の音を消して録音するといったことなども可能になったという。また、音の立ち上がりだけでなく、例えば人の声の周波数は定常性が高いという特徴を活かし、選手の声などをより多く拾って臨場感を高めるといった用途にも応用可能としている。

 東京オリンピックが開催される2020年に向けた改良も予定しており、より遠くの音にも適用できることや、さらに多くの種類の音を抽出できるようにするといった研究開発も進めていく。

特定の音をクリアに抽出したいというニーズ
NHKとの実証実験に至った経緯
今後の予定

(中林暁)