日沼諭史の体当たりばったり!
第39回
深刻なオンラインの「録画・録音しにくい問題」。解決策は“ダブルイヤフォン”!?
2021年1月15日 08:30
みんな一体どうやって録画・録音しているのだろう、とずっと疑問に思っているのだ。ミーティングやら取材やらが軒並みオンライン化したことで、現地と自宅を往復する手間を省けるようになったのはうれしいけれど、リアルでできた方が手軽に済むことも少なくない。録画・録音はその1つだ。みんな、一体どうやってるの?
オンライン会議ツールの録画機能や、OS標準のスクリーンキャプチャー機能があるのはもちろん知っている。でも、後述するように、それらは確実な録画・録音手段にはなりえない。筆者としては、それよりも安定して、間違いなく記録を残せる手段が欲しいのだ。
たとえばリアル取材でICレコーダーを2台使うみたいな、それでも不安だから同時にビデオカメラも回すみたいな、そのレベルの慎重さでオンラインでも記録したい。オンラインだろうとリアルだろうと、(特に取材時の録音は)失敗したらアウト。取材後に録音できていないことに気付いたときのあの絶望と、脇下を流れる汗の感覚は二度と味わいたくない(経験者)。
なので、確実に録画・録音しつつ、それでいてPCとにらめっこするオンラインのスタイルで快適かつ正確に音声を聞き取れる環境を構築したい。さて、どんな機器構成が考えられるだろう。完璧に録画・録音できるオンライン会議・取材のスタイルを模索してみた……ら、最終的に「ダブルイヤフォン」のスタイルになってしまった。どうしてこうなった!?
オンライン会議ツールの録画機能は期待できない
そもそもなぜ録画・録音したいのかというと、たとえば取材では、録音した音声を後で聞き直して文字起こしする場合があるから。その場で全員の発言を一語一句間違えることなく正確にタイプできれば録音の必要はないのだが、そんなスキルを持っていない筆者には不可能だ。オンラインでは時々相手がデスクトップを画面共有することもあり、その映像を後で参考にするときもある。なので、映像と音声は絶対に残しておきたい。
そこで一番手軽できれいに録画・録音する方法として挙げられるのが、「オンライン会議ツールの録画機能」や「OS標準のスクリーンキャプチャー機能」だろう。しかし、そもそもオンラインでの録画・録音の手段を本気で模索しようと思ったきっかけが、これらの機能に問題があったからなのだ。
たとえばオンライン会議ツールの録画機能は、多くの場合、ホスト(その会議をセッティングする人)にしか録画の権限がない。筆者自身が主催することはほとんどないのでホストにお任せしてしまうしかなく、ホストが録画を忘れてしまえばその時点で終了である。恐ろしい。
Watchのような媒体系の編集部の方も同席することが多いインタビューだと、ホストはだいたい編集部の人なので、忘れていそうならその場で録画をお願いしやすいのだが、自分がその声かけを忘れてしまわないとも限らない。録画されていても、ホストの人の設定によっては録画解像度が低すぎて使えないものになる可能性もある。
一般のオンラインイベントとなると、もはや公式の録画映像は期待できない。主催者が録画していない場合もあるし、こちらから録画をお願いすることもできないし、よしんば録画していてもその映像をもらえるとは限らない。いろいろな手間や不都合の元を絶とうと考えると、なんとかして自分の手元で録画・録音するしかないのだ。
OS標準のスクリーンキャプチャー機能は信頼できない
そうすると、必然的にOS標準のキャプチャー機能が1つ目の手段として挙がるのだが、意外と落とし穴も多い。たとえばWindows 10には「ゲームバー」によるキャプチャー機能が用意されている。キャプチャーしたいウィンドウをアクティブにした状態で「Windows+G」キーを押し、キャプチャーボタンをクリックするか、もしくはそのショートカットとなる「Windows+Alt+R」キーを押せば録画が始まる、というものだ。
しかしながら、場合によっては一番重要な音声が入らず、映像だけのデータになってしまうことがある。これは、おそらくゲームバー上で選択されているキャプチャー対象の音声出力と、オンライン会議ツール上で選択している音声出力が一致していないことが原因と思われる。
ただ、直前まで同じ音声出力を選択していたのに、録画を始めた瞬間に別の音声出力に切り替わってしまったりもするようで、いまいち信用ならない。Bluetoothヘッドセットを使用したときの接続の兼ね合いで問題が起こっているようなところもあるが、いずれにしても不安定である。録画中、レベルメーターなどで音声が取り込まれているのかを視覚的に確認できないのも不安で仕方がない。
さらに言うと、ゲームバーによるアクティブウィンドウの録画(キャプチャー)は、そのウィンドウのサイズが変更された瞬間に勝手に停止してしまう問題もある。うっかりリサイズしたり、最小化したりするだけでストップするのだ。
Zoomでは相手が画面共有した瞬間に自動で全画面表示になったりするので、そこで停止する(常に全画面表示しておくか、あらかじめ全画面にならないように設定しておけば問題ないが)。録画が停止したことに気付かなければおしまいだし、気付いたとしても画面の共有・解除のたびに何度もキャプチャーをリスタートする手間が煩わしい。
そういうわけで、オンライン会議ツールの録画機能も、OS標準のゲームバーによるキャプチャーも、「絶対に失敗せずに録画・録音したい」という要求には応えられない手段なのである。ちなみにmacOSのスクリーンキャプチャー機能の場合、デスクトップ全体を録画することもできるが、こちらも音声が記録されないことがあり、信頼性の程度はゲームバーとさほど変わらない。
アナログな「再撮」は確実性は高いが、聞き取りや文字起こしに向かない
デジタルとアナログの融合というのも、まあまあ有効な手段ではある。たとえば、一応スクリーンキャプチャーの機能を使って録画しつつ、万一音声が録れていなかったときのために、ICレコーダーをスピーカーの前に置いておく、というスタイルだ。
ただしこの場合(スクリーンキャプチャーに失敗してICレコーダーの音声を使わざるを得ないとき)、その後の文字起こしの作業で問題になる。スピーカーから出力されたものを改めてICレコーダーのマイクで録音しているわけで、生声やデジタルのまま録音するより確実に「音質」は悪化する。
筆者自身のキータイプ音や家族の声など、周囲の雑音も拾いやすい。録音を聞き直すときの邪魔になるし、最近よく使っている自動文字起こしのサービスでも、ノイズが入ると少なからず認識率は下がってしまう。
オンライン会議・取材をしている最中の「聞き取りやすさ」という意味でも、スピーカーは適しているとは言えない。相手の言葉が周囲のノイズに紛れて聞き取れないのはよくあること。イヤフォンやヘッドフォンのように、可能な限り耳の近くで、周囲の音を遮断する形で聞ける体勢で臨みたいのだ。
なので、できればマイクとヘッドフォンが一体になったヘッドセットを使いたい。(相手からの)見た目や取り回しを考えるとワイヤレスイヤフォン一択になるのだが、しかしここにも問題がある。ワイヤレスにした瞬間、ICレコーダーなどでアナログ的に録音する手段が失われてしまうのだ。
もし有線ヘッドセットなら、音声入出力を分岐させるだけなのでそこまで難しくはなさそう。なのだけれど、Bluetoothのようなワイヤレス方式のヘッドセットだと分岐するのは簡単ではない。ワイヤレスだと会議・取材の最中は快適かもしれないが、ICレコーダーで録音できないのでは意味がないぞと。
で、結局スクリーンキャプチャーに頼ることになるわけで、後で録音できていないことに気付いたときのあの絶望と、脇下を流れる汗の感覚は……。
確実に録画・録音できる方法を考えてみる
こうしたいろいろな問題から、オンライン会議・取材において「確実に録画・録音する」のが意外と難しいことがわかっていただけただろうか。そのうえで聞き取りやすい環境も整える、というのはかなりハードルが高いのだ。だから、みんなどうやってるの? と思っているのである。マジで教えてほしい。
と、どこかの誰かに懇願したところで解決しないので、自分でどうにかできないかいろいろな方法を考えてみた。実現にあたっては、少なくとも下記の条件をクリアしなければならない。順番に解決していってみよう。
- 音声付きのスクリーンキャプチャーをより確実に行なう
- ICレコーダーでバックアップしつつBluetoothヘッドセットも使う
1. 音声付きのスクリーンキャプチャーをより確実に行なう
スクリーンキャプチャーの改善は、実はそれほど難しくない。OS標準のスクリーンキャプチャーの代わりに、「OBS Studio」のようなサードパーティアプリケーションを使えばいい。
OBS Studioはライブ配信がメイン用途のツールだが、仮想カメラの機能を使って、オンライン会議・イベントなどで凝った映像を見せたいときに使っている人もいるかもしれない。しかしここでは、OBS Studioがもつスクリーンキャプチャーの機能と、その映像をファイル保存する機能だけを利用する。
スクリーンキャプチャーの対象はデスクトップ全体とする。特定のウィンドウのみをキャプチャーすることもできるが、オンライン会議ではその時々によって異なるツールを使う可能性がある。キャプチャーする対象を都度設定変更する手間が発生してしまうので、できるだけ面倒を省き、安全に記録することを考えると、デスクトップ全体を記録しておいた方がいい。
音声ももちろん同時に記録できる。設定画面の「音声」で、オンライン会議ツールでスピーカー・マイクとして使っているものと同じデバイスを指定する。「出力」設定も確認したら、あとは「録画開始」ボタンを押すだけだ。
もちろん、この音声デバイスを選択するところでミスする可能性は大いにある。が、OBS Studioの場合はきちんとレベルメーターで入力状況をチェックできるから安心だ。「オーディオの詳細プロパティ」で「モニターのみ(出力はオフ)」を選ばないようにする、というところだけは注意したい。通常は「モニターオフ」にしておこう(モニターをオンにするとエコーが発生する場合がある)。
2. ICレコーダーでバックアップしつつBluetoothヘッドセットも使う
OBS Studioでしっかり録画・録音されていれば、本来は外部のICレコーダーを使ってまで録音する必要はない。が、何が起こるかわからないのがコンピューターソフトウェアである。やはりバックアップは必要だ。オンライン会議・取材中にOBS Studioがフリーズするとか、強制終了するとか、設定ミスで音声が入っていないとか、動画ファイルの保存に失敗するとか、いろいろな可能性が考えられる。
事前のテストでは問題なかったのに、よりにもよって本番でそういうことが発生しがちだったりするから油断できない。ちょっと古いが、マーフィーの法則ってやつである。できればソフトウェアだけに頼らず、バックアップとしてハードウェア(ICレコーダー)での録音手段も用意しておきたいのだ。
ただし、Bluetoothヘッドセットを使うという前提条件も考えると、PCの音声出力から有線でICレコーダーにつなげばいい、というような単純な話にはできない。ICレコーダーには物理的にLINE IN(マイク IN)に接続して音声入力させながら、同時にBluetoothヘッドセットで会話できるようにする、という工夫が必要だ。
ここで出番となるのが、「VoiceMeeter Banana」という仮想の音声デバイスを作ることができるアプリケーションだ。本誌の他の記事でもすでに紹介されているが、これを使えば、1つまたは複数の音声ソースを、PCの内部で複数のデバイスに分配できるようになる。
Windowsユーザにオススメの万能仮想ミキサー「VoiceMeeter Banana」が凄い
たとえば今回の場合、オンライン会議ツールでやりとりしている音声を、BluetoothヘッドセットとICレコーダー(PCのオーディオ出力端子)に同時出力することが可能だ。さきほど設定したOBS Studioでも録画・録音できているので、通常はそちらだけで間に合うはずだが、ICレコーダーでも録音できるようにしておけば万全のバックアップ体制が整うだろう。
オンラインならではのメリットを追求したい!
これで、ある程度安心度の高いスクリーンキャプチャーと音声記録のバックアップが可能になり、同時にBluetoothヘッドセットを遠慮なく使える目処も立ったので、条件はクリアできたと言える。が、せっかくならもっとこだわって、品質向上と仕事の効率化を図ってみたい。オンラインだからこそできることが、きっともっとあるはずだ。
というわけで、さらなる改善ポイントとなるのは下記の3つである。
- オンライン会議・取材中のノイズを可能な限り低減する
- リアルタイムで自動文字起こしできるようにする
- Bluetoothヘッドセットで、より高音質で聞けるようにする
1. 音声以外のノイズを可能な限り低減する
自分のマイクをオンにした状態でキーボードをタイプしたりすると、それがノイズとなって他の人に聞こえてしまう。こういったノイズを防ぐノイズリダクションの機能はぜひとも取り入れたいところだ。
筆者がそのために使用しているのは、「NVIDIA Broadcast」。最近ではオンライン会議ツール自体に同等の機能が組み込まれているものも出てきたが、そうではないツールもまだ多い。ツールによってノイズ低減の程度や精度に差があったりもするので、仮想マイク・スピーカーデバイスとしてどのツールでも共通で使えるNVIDIA Broadcastのメリットは大きい。ネックとなりそうなのは、NVIDIA GeForce RTX 20シリーズ以降のGPUにのみ対応、という点だろうか。
使い方は、まず最初にNVIDIA Broadcastの設定画面を開き、使用するマイクデバイス(Bluetoothヘッドセット)を「マイクソース」から選んで「ノイズ除去」を有効にする。次にオンライン会議ツールやOBS Studioなどでマイクデバイスに「NVIDIA Broadcast」を指定すればOKだ。
さらにVoiceMeeter Bananaでも、「HARDWARE INPUT 1」に「NVIDIA Broadcast」を指定しておき、その出力先となるICレコーダーなどにもノイズ低減の効果が適用された(自分の)音声が記録されるようにしておこう。
ちなみにNVIDIA Broadcastではスピーカーデバイスから出力される音(相手の音声)についてもノイズ低減の効果を適用できる。が、その効果の適用度合いによっては反対に聞き取りにくくなってしまう場合もあるので、何度か試しながら慎重に設定したい(筆者は使っていない)。
2. リアルタイムで自動文字起こしできるようにする
最近は音声の自動文字起こしサービスである「Rimo」も活用している。通常のルーチンだと、スクリーンキャプチャーした映像から抜き出した音声データか、ICレコーダーで録音した音声のデータをRimoにアップロードして解析させる、という手順になる。
Rimoでは、1時間程度の内容でも数分~数十分ほどの短時間で高精度にテキスト化してくれる。とはいえ、アップロードの手間がかかるし、その前に動画から音声を抜き出したり、音声データの余計な内容をカットする作業もわりと面倒だ(Rimoは最近動画ごとアップロードできるようになったが、無駄に回線に負荷をかけないためにも、軽い音声データのアップロードで済ませたい)。
その手間を省くには、Rimoのリアルタイム録音機能を使えばいい。通常は、スマートフォンでWebブラウザーからRimoにログインし、マイクアイコンをタップして録音を始める、という形になるだろう。どちらかというとリアルの会議・取材などを想定した機能だからだ。
しかしながらVoiceMeeter Bananaがあれば、PC上のオンライン会議・取材でもRimoのリアルタイム録音機能が利用できる。オンライン会議ツールの音声や自分のマイクの音声を1つの仮想出力デバイスに出力するようにしたうえで、その仮想出力デバイスをRimo上でマイクデバイスとして認識されるようにすればいい。
通常、Webブラウザー(ここではChrome)上で認識するマイクデバイスは、OSでデフォルト設定されているものが使われる。VoiceMeeter Bananaの仮想出力デバイスがデフォルトになっていなかったり、何らかの問題でWebブラウザー上で別のデバイスが認識されている場合は、Webブラウザーの設定画面で仮想出力デバイスを選択しておこう。
これで、オンライン会議・取材中にリアルタイムでRimo上でも録音され、もう1つのバックアップとして音声データを残せるだけでなく、録音完了後にすぐに文字起こしの処理を実行できるようになる。安心感がさらに増すとともに、効率良く仕事できることにもつながるだろう。
3. Bluetoothヘッドセットで、より高音質で聞けるようにする
そもそもの目的がオンライン会議・取材でのやりとりなので、ここまで使ってきたBluetoothヘッドセットは、ヘッドフォンとしてではなく、当然ながら音声入出力用のヘッドセットとして使ってきたことと思う。オンライン会議ツールなどで指定したのは「ヘッドセット」というデバイスだったはずだ。
たとえばWindowsでは、同じBluetoothヘッドセットでも、「ヘッドセット」と「ヘッドホン」の2つのデバイスを選べるようになっている。この違いは使用するプロファイルだ。ヘッドセットではHFP(Hands-Free Profile)と呼ばれるものが、ヘッドホンの場合はA2DP(Advanced Audio Distribution Profile)と呼ばれるものがそれぞれ使われる。
ざっくり言うと前者は音声向け、後者はオーディオ向けということで、音質にも大きな差がある。仮にWindows上で再生デバイスに「ヘッドセット」を選んだ場合と、「ヘッドホン」を選んだ場合とでは、音楽を聞いたときの聞こえ方が全く異なるはずだ。「ヘッドセット」ではモノラルになり、音域も狭くなって、とても音楽鑑賞に耐えられない。
オンライン会議ツールでは通常はマイクとイヤフォンの両方を使うのでヘッドセットを選ぶことになるわけだけれど、その場合は決して高音質ではない音声でやりとりしていることになる。もちろん、ほとんどが会話音声なので音質的にはそれで十分と言えなくもないのだけれど。
でも、できるだけキレイな音で聞くことができれば、聞き取りやすさが多少なりともアップするはずである。とはいえ、多くのBluetoothヘッドセットは、ヘッドセットとして使っている間はヘッドフォンとしては使えない。どうすればいいのか。
答えは「Bluetoothヘッドセットを2台用意する」である。いや、もっと正確に言うと「Bluetoothヘッドセットとは別にマイクを1つ用意する」である。筆者がPCでまともに使える単独のマイクを持っていないので、手元にあったBluetoothヘッドセットを2台組み合わせただけだ。単独のマイクがあればそれに越したことはない。とりあえずここではBluetoothヘッドセット2台を使って話を進めよう。
結局のところ、1台をマイク用として、もう1台をヘッドフォン用として使う、というだけの話である。といっても、フツーにヘッドセット2台を使うのは、だいたい無理だ。耳穴が足りない。耳穴が片方に2つずつある人間だったら可能だが、たぶんそんな人はいないだろう。片耳ずつ別のものを付けるという方法もあるが、それではステレオで音楽をすぐに聞きたいときに聞けない(会議・取材中にやることではないが……)。
なので、どちらか一方を耳穴を埋めない骨伝導方式のヘッドセット(イヤフォン)にし、もう一方を普通のワイヤレスヘッドセットにする。できれば後者は完全ワイヤレスの方がいいだろう。ケーブルが少ない方が煩わしくないのだ。
耳周りの圧迫感はやや強めになってくるところはあるものの、これで可能な限りの高音質で会話しつつ、そのまま何もしなくても動画・音楽鑑賞もできるのだ。まあ、普通のヘッドセット2個でも、一方はマイクとして使うだけなので近くに置いておくだけでもいいのだけれども……。マイクを口に近づけて、声を拾いやすくして相手にきちんと伝わるようにする、というのも重要なので……。
少しでもラクをしたいなら「FiiO BTA30」などのトランスミッターを使おう
最終的にはツールやハードウェアを多数組み合わせる形になり、セッティングがちょっと複雑になってしまった。かえってオンライン会議・取材を始める前の準備が大変になってしまった気がしないでもないが、これを少しでもシンプル化したいなら、Bluetoothトランスミッターなどを組み合わせるのもおすすめだ(さらにハードウェアが増えてしまう!)。
たとえば2020年12月に発売された「FiiO BTA30」。これは、USBやオーディオケーブル(光、同軸、アナログRCA)で入力した音声をBluetoothでデバイスに送信するトランスミッターの機能と、反対にスマートフォンなどからのオーディオデータを受信してケーブル接続した機器に出力するレシーバーの機能をもつアイテムだ。
トランスミッターの場合はBluetoothデバイス2台に同時に音声出力可能で、SBC/aptX Low Latency/aptX HD/LDACに対応、レシーバーの場合はSBC/aptX/aptX HD/LDACに対応と、多数のコーデックが利用できるのも特徴だ。さらにPCとUSB接続することでUSB DACとして動作するようにもなっている。
こういったBluetoothトランスミッターを使うと何が便利なのかというと、VoiceMeeter Banana上で指定するデバイスをBluetoothトランスミッターに固定できるところだ。Bluetoothヘッドセットは使い始めるときに電源を入れ、使い終わったら必ず電源をオフにするもの。それもあって、ツール上ではオンオフのたびに使いたいデバイスを選び直さなければならない場合がある。
基本的には前回接続したものが記憶されているはずだが、特にVoiceMeeter Bananaにおいては、Bluetoothヘッドセットを再接続してもすぐには音声出力されない場合がある(オフにしたときにフリーズすることもある)。起動してデバイスを選び直して、初めて音声出力されることがあるため、手間がかかるうえに混乱の元となる。ここを電源のオンオフがほぼ必要ないFiiO BTA30のようなBluetoothトランスミッターにしておけば、一度VoiceMeeter Bananaの設定が固まればあとはノータッチでいいのだ。
このためだけに高機能なFiiO BTA30を使うのはもったいない気がしなくもない。せっかくなら高音質・低遅延の最新Bluetoothヘッドフォンの性能を活かしきれるオーディオ環境のハブとしても活躍させたいところ。FiiO BTA30が1台あれば、オンライン会議・取材だけでなく、普段の動画・音楽鑑賞も、クオリティがぐんとアップすること間違いなし。次は低遅延・高音質環境を求めて、FiiO BTA30の性能にマッチする新たなBluetoothヘッドセット探しの旅に出かけそうな予感である。