小寺・西田の「金曜ランチビュッフェ」

本稿はメールマガジン「小寺・西田の『金曜ランチビュッフェ』」からの転載です。金曜ランチビュッフェの購読はこちら(協力:夜間飛行)

録音がそのままテキストに?! 「Recoco」はライターの福音となるか

先日から、取材録音にあるアプリを使い始めている。それは「Recoco」というiOS用アプリだ。

|https://itunes.apple.com/jp/app/recoco/id1183772977?mt=8|「Recoco」|@@現在は無料で使える

このアプリ、どういうものかは次の画像を見れば一発でわかると思う。録音したデータを自動的に音声認識し、テキストをつけてくれるのだ!

録音をすると自動的に音声がテキストに。精度はまだ難があるが……

音声認識機能の向上により、講義やインタビュー、打ち合わせなどの録音からテキストを作りたい……ということは多くの人が考えた。だが、それを実現しているアプリやサービスはなかなかないのが実情だ。まだ、いまは。

Recocoは、アップルのSiriがもっている「Apple Speech Framework」を使い、録音開始と同時に音声を認識し、同時記録する。そのデータはテキストとして他のアプリに持っていくこともできるし、「字幕ファイル」として書き出すこともできる。VLCなどの字幕ファイルに対応したソフトであれば活用可能だ。

認識したデータは「字幕」ファイルとして記録される

なんてすばらしい、ゆめのような……

というあたりでそろそろ現実に戻っておきたい。さすがに、今の技術では完璧なテキスト化はできない。以下は、先日あったソニーの有機ELテレビ発表会での、ソニー・高木一郎EVPへの囲み取材録音時の「認識データ」のごく一部である。未編集のデータで、テキストの上にあるのはインデックスのためのコードである。

===============================================

00:01:16.647,00:01:19.399
ちゃんとソニーのブランド

00:01:23.478,00:01:34.165
ちゃんとソニーのブラビア生で普通の商品頭そうにらしい

00:01:49.480,00:02:02.029
続きの市場端戸が休みだとがコンテンツねーある程度子供なんてのかなあのアバルトの発展性が見えなくなってる時期が

00:02:04.528,00:02:16.428
ただしネット経由のコンテンツが急速に多分34年前からでも痩せNetflixネット本店クオリティーが

00:02:18.738,00:02:27.201
ノイズが少ない高画質しかも音質も非常に良いと理論の夜子のコーデックの子

00:02:29.708,00:02:41.039
他方そう?アンペードある程度制約があって得コンテンツの夜放送はねのけようとすると質が落ちる

===============================================

ごらんのように、文章にはなっていない。ここから原稿にするには向いていないものだ。

しかし、である。

そもそもこのアプリは、「録音を完璧な書き起こしにする」ことを目的としたものではないのだ。このアプリが狙うのは、「録音データにテキストのインデックスを自動でつける」ことにある。

前出のデータは、精度の面で問題がある。しかし、なんとなくなにを言っているかはわかる。自分の中には「そこでどんな話題がどのくらいの時間で出たか」は覚えているので、両方を付き合わせると、「聞き直したい場所にすばやく飛んで、内容を確認する」ことができる。これだけでも、録音データの活用としては非常に有用なものである。

実は筆者は、もともとそういう形で取材データを活用していた。

Microsoftの「Onenote」(同名のスマホ版があるが、ここではWindows版とMac版のみの機能)や、Ginger Labs Inc.の「Notability」(MacとiOS向け)、Luminant Softwareの「AudioNote」(Windows版、Mac版、iOS版、Android版がある)といったソフトでは、「テキストや手書きのメモと、録音データを同期記録する」ことができる。要は、録音しながらメモをとることで、後々「メモの部分をクリックすると、そのメモを書いた時に録音した部分が再生される」のである。だから、メモを見ながら記事化したいところだけ内容確認ができるので、効率がアップする。筆者は主にNotabilityを使っているが、手放せないものである。

OnenoteやNotabilityが「メモを自分で書いて、それをインデックスにする」ものであるとすれば、Recocoは「自動的にインデックスを作るもの」という違いがある。しかし、設計思想としては似ている。Recocoは元々、筑波大学に在学中の藤坂祐史さんが、講義・授業の記録を再確認しやすくして、学習効率を上げるためのアプリとして開発した経緯がある。その観点でみれば、まさに「重要ポイントに自動インデックスがついて、そこを聞き直す」ことが重要だったわけだ。

筆者としては、両方を使うことでより聞き直しの精度を上げることができるのが有用だと考えた。

PCやMac、iPadなどでOnenoteやNotabilityを使い「録音しながらメモをとる」場合の欠点は、PCなどのマイクの精度にある。どうしても性能は専用のICレコーダーやビデオレコーダーに劣るので、聞き直した時に不明瞭になりやすいのである。また、タイプでメモをとる場合、キータイプ音も同時に録音されることになるので、それが聞き直しのさまたげになる。

そのため筆者は、音の良い専用機器(今はShureのマイク「MV88」をiPhoneにつけてつかっている)で別途精度の良い録音を行い、PC/Macのメモを見つつ、聞き取れないところを別途録音データから、「録音時間」を手がかりにピンポイントに手作業で呼び出して聞き直す……というやり方を併用していた。

これが、Recocoの採用で、ずいぶん楽になった。Recocoの側のテキストインデックスを使うことで、「万が一」の聴き直しがしやすいからだ。MV88をつけるとiPhoneのマイクで録音するより音も良くなる。

一方で、iPhoneのマイクをそのまま使うことの良さもある。さきほど「囲み取材」の例を出したが、相手が近い時には、わりとiPhoneのマイクの「周囲のノイズを下げる」能力が生きてくるようだ。OnenoteやNotabilityを使う欠点は、囲み取材時のメモにインデックスをつけづらいことにある。だがRecocoなら、紙のメモやスマホのタイプを併用しなくてもいい。

完璧ではないが、併用でかなり有用になるアプリ、というのが、今のRecocoに対する評価である。おそらく記者でない皆さんの場合にも、「会議のメモ」や「商談メモ」で十分活躍できるのではないだろうか。

一方で、こうも思うのだ。

機械学習による音声認識は、この数年で劇的に精度を上げた。いまでこの精度ならば、さらに数年後には、もっともっといいところまでいくのではないか。機械翻訳は、5年前はひどいものだった。しかし、今の機械翻訳の精度はあなどれない。十分仕事の補助になる。それと同じようなことが、「音声認識によるテキスト化」にも起こる……と確信できる。

Recocoのようなアプリは、その未来を十分に予見させてくれるものだ

小寺・西田の「金曜ランチビュッフェ」

本稿はメールマガジン「小寺・西田の『金曜ランチビュッフェ』」からの転載です。

コラムニスト小寺信良と、ジャーナリスト西田宗千佳がお送りする、業界俯瞰型メールマガジン。

家電、ガジェット、通信、放送、映像、オーディオ、IT教育など、2人が興味関心のおもむくまま縦横無尽に駆け巡り、「普通そんなこと知らないよね」という情報をお届けします。毎週金曜日12時丁度にお届け。1週ごとにメインパーソナリティを交代。

--
2017年5月12日 Vol.126 <技術の進歩に恐れ入る号> 目次

--
01 論壇【小寺】
 銃を撃つ
02 余談【西田】
 録音がそのままテキストに?!「Recoco」はライターの福音となるか
03 特集【小寺】
 NAB2017レポート (1)
04 過去記事【小寺】
 「通信の最適化」は許される!? 試される顧客満足度
05 ニュースクリップ
06 今週のおたより
07 今週のおしごと

Amazonで購入
小寺・西田の「金曜ランチビュッフェ」
Vol.126 Kindle版

西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、週刊朝日、AERA、週刊東洋経済、GetNavi、デジモノステーションなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。
 近著に、「顧客を売り場へ直送する」「漂流するソニーのDNAプレイステーションで世界と戦った男たち」(講談社)、「電子書籍革命の真実未来の本 本のミライ」(エンターブレイン)、「ソニーとアップル」(朝日新聞出版)、「スマートテレビ」(KADOKAWA)などがある。
 メールマガジン「小寺・西田の『金曜ランチビュッフェ』」を小寺信良氏と共同で配信中。 Twitterは@mnishi41