プレイバック2021

Google Pixel 6 Proの文字起こし機能だけで記事を書いてみた by 麻倉怜士

(この記事は、Google Pixel 6 Proの音声レコーダーアプリに吹き込み、リアルタイムで日本語化したものです。Pixel 6 Proの間違いはパーレンの赤字で訂正しています。私の滑舌が悪いのも、間違いの原因です。また吹き込み時の空白時間で生じたピリオドは、読みやすく詰めています)。

私も編集者時代から多く経験しているのですが、文字起こしは本当に大変で、死ぬほど嫌な作業でした。1 時間のインタビューを取って(録って)、真面目にしっかり文字に起こすと、その数倍は時間が取られる。本当にこの作業はどうにかならないものかと。1980年代の私は編集者だったんですけど、すごくそう思っていました。

今は、そうした全文書き起こしなどの作業はあまりすることはなくなったのですが、でもやはりメモの録音をしっかり聞き込むとか、そこから文字を起こすとかいうのは時々あり、本当に嫌な作業だなと、かつての体験を思い起こしながらいつもそう思っていました。ところが円(縁)あって、これを使ってみて大変びっくりしました。この音声レコーダーという機能はものすごくパワフルで、これまで夢に見ていたことが本当に実現したようなき(気)さえします。

Google PIXEL 6 PRO

この原稿は文字を書くのではなく、声でピクセルに向かって吹き込んでいます。それをピクセルはリアルタイムで日本語にしてくれているわけです。その出来栄えはどうでしょうか?

すごいですね。思うにおそらく一般的な用語だけで語る文章は95%以上の正解率ではないでしょうか? まあ、オーディオビジュアルにはかなり専門用語も多いので、信号(新語)なども多いですよね。その場合はやはりつまずくことがあって、それは仕方がないというか、全然別の言葉になってしまうこともありますが、少なくともフラットな分(文)で、丁寧な一般語で喋るなら、ほとんど間違いなくしっかりとした日本語にしてくれます。

このスマホを使い始めたのが11月頃で、ちょうどインタビュー(InterBEE)という国際放送機器展示会がありました。ぜひ取材に行こうということで、取材にこのピクセルを使ってみました。本当に驚いたんですけども、ソニーブースでカメラを解説する人の言葉が、そのまま全くジャストな日本語で出てくる。それも面白いように、早く出てくるというか、リアルタイムで出てくるというか、実際問題はリアルタイムでピクセルくんが日本語に変えるんですけども、当然間違えはあるんですよね。でも、次の言葉が出てくると、その前の間違いの言葉が訂正されてすぐにまた表示されるということの繰り返しで、本当にレイアウトタイム(リアルタイム)性があると思いました。

InterBEEの取材でGoogle Pixel 6 Proを活用してみた

インタービーはブース内ですから、結構うるさいんですけども、このスマホをそれなりの位置というか、まあ前の方に掲げておくと、その解説の人の言葉がそのまま日本語になるというのは本当にびっくりしましたね。

結構うるさい会場内でも、解説の人の言葉をしっかり日本語化してくれてる!

その会場で、じゃああの人(ジャーナリスト)や広報の方にお会いして、この書き起こしを見せてあげたらですね、もうみんなも目を丸くしてびっくりするわけです。見せてあげるというか、はじめは、何も言わないでこのスマホを手に持って、エレク(REC)スイッチを入れる。インタビューとかのちゃんとした語りだけでなく、日本語のおしゃべりであれば何でも日本語にしてくれるということなので、こんにちはとか。おはようございますとか、本当にインタビーが再開してよかったですね、みたいな言葉で挨拶するわけですけども、その言葉のやり取りがそのまま文字になってくるというのを見ると、本当にびっくりですね。

会場で出会った方々の反応を報告しましょう。まず、大手家電メーカーの広報担当者さんですが、この日本語の表示を見てこんなことができるのと、大変驚いていました。よく聞いてみると、こうした機能は候補(広報)の日常業務にとても必要のようです。ジャーナリストや新聞記者と社員とのインタビューをセッティングするわけですけども、その時には必ず、メモを取ってるわけです。必ず手掛け(手書き)でメモを取ってる。これがですね、このピクセルくんを導入すると大変合理化されるのではないかということをおっしゃっておりました。

実際これまでもいくつか書き起こしソフトを試されたそうですが、どれも全く使い物ならない。つまり書き起こしたものはほとんどが訳の分かんない日本語であって、それを直すことに時間にたくさん取られるということらしいんですね。なので、このピクセルくんの書き起こしはとても素晴らしい、これはぜひ手に入れたいなとおっしゃっておりました。

もう1人、有名な作家さんとお会いしました。私と長年お付き合いのある方なんですが、これを見て、ものすごく興奮してました。こんなことができるの、こんなことってありえんのというぐらいの驚きだったんです。

実はよく聞いてみると、彼なりの悩みがあったようです。この作家先生は大手出版社でレポートを書いたり、記事を書いたり、本を出したりしてるんですけども、取材のインタビューは、編集部の方が書き起こしをしてくれる。でも編集部がやるわけがなくて、業者さんに出すんですね。そうすると何と1時間3万円だそうです。

この作家先生はですね。出版社の経理から何でこんなにお金がかかるのと、お叱りをいただいたということで、困り果てて、しょうがないか、自分で起こそうかな? みたいな弱気なことも言ってたわけです。

それが。このピクセルを見てこんなことができるのか、つまり自分と対象とのインタビューがその場で文字になるなんて、こんなことは夢のようだということで、早速その日のうちですね、購買に走ったということです。本当にニーズに全くジャストミートした物が出たというわけです。

では私はどうやって使ってるかということをお話ししましょう。大昔の編集時代、私はプレジデントという経済雑誌の記者をやってたんですけども、その時にはやはり取材をして、当時はカセットテープを回して後で聞いて文字起こししていました。一時、とても大事な作家先生へのインタビューテープを間違って消してしまい、記憶を頼りに大急ぎで思い起こしながら語りを綴ったという記憶があります。

今は、そういうことをしないというか、こんなことしていては仕事にならないということで、なるべくメモだけで、テープを取らないで取材をするということにしています。IC レコーダーを元に書き起こすということは最近は、あんまりやってないんですね。実は昔からいろんな有名な人に会ってるんですが、そんなわけでテープに取らんなかったことが結構あってですね。今となっては惜しいなという感じがします。

まあ、それはどうでもいいんですけども、今は連載しているステレオサウンドさんウエブ記事で活用しています。これは私の語りということになってますので、私の語りをこのピクセルくんに入れて、そのファイルを編集者さんに渡しています。そうすると、大変喜ばれまして。つい最近のあのIキューブ研究所(アイキューブド)の記事の、私へのインタビューではまさにこのピクセルくんです。ピクセルくんに吹き込んでえー。そのファイルを編集者さんに渡して、パソコン上で編集する。その結果、文字起こしの時間が大幅に削減される。100%完全原稿で取れる(縁れる)わけではないので、その転生(訂正)時間というのは必要なんですけども、いずれにしてもですね、ICレコーダーで撮って(録って)、それを耳で聞いて、味(頭)の中で日本語に変えてパソコンに打ち込むという作業が全くもって大幅に合理化されたということは間違いないですね。

私の活用法をご紹介しましょう。インタビューの記録などは当然、この文字で見られるのがいいわけですけども、もう1つ自分の発想メモみたいな物も面白いんじゃないかと思いますね。思いついたことをメモとして紙に書くというのが基本ですけども、思いついたらならば思いついたままを喋って、ピクセルくんの中に吹き込んでおく。

自分の喋りというものが口で声が出て、またそれを脳内もしくは耳で聞いてるわけですので、やっぱり反応が自分自身の中であるような、全く無言で頭の中で考えている時よりも、やはり頭の中の反応みたいなものが、とても敏感なような感じがします。声で出してる方が新しい発想がそこから生まれるみたいですね。そういう意味では、この素晴らしい音声からの書きを起こし機能をたくさん活用したいと思います。

というわけで、2021年は私の閻魔帳を読んでいただきありがとうございました。来年もこのスマホというか、レコーダーを活用して、良い記事をたくさん書きたいと思います。ここまでこの記事の作成時間は25分でした。

麻倉怜士

オーディオ・ビジュアル評論家/津田塾大学・早稲田大学エクステンションセンター講師(音楽)/UAレコード副代表