藤本健のDigital Audio Laboratory
第848回
最も音が良い会議アプリは? 声優・小岩井ことりさんと音質比較してみた 後編
2020年4月27日 11:16
テレワークにおけるミーティングでも、大学をはじめとする学校の授業でも、そして飲み会でも活用されているオンライン会議アプリ。
ZoomやSkype、Teamsといったアプリがあるおかげで、自宅に居ながらにして快適にコミュニケーションが取れるのはいいのだが、その通信において映像の質や音質が悪いと、コミュニケーションの質も落ちてしまう。とくに音質の良し悪しは、そのやりとりにおいて大きな影響を与えるが、どのオンライン会議アプリがいいのだろうか?
もちろん、どれがいいかは会議の目的にもよるだろうし、通信回線によっても変わってくる。また、PCを使うのかスマホを使うのか、内蔵マイク・スピーカーで行なうのか、オーディオインターフェイスを利用するのか……などなど条件によって変わってくるので一概に言えない。
そうした中、理想的な通信環境・オーディオ環境があった場合、どのアプリが最も音質に優れるか、先日声優の小岩井ことりさんとともに、実験を行なってみた。正確には小岩井さんの実験結果に相乗りさせてもらったという感じではあるが、その実験手法については前回の記事で紹介した通りだ。
今回はその実験を行なった結果、具体的に7つのオンライン会議アプリで、どのように音に違いがあるのか、小岩井さんのデータを詳しく見ながらチェックしていくことにしよう。
Skype、LINE、Zoomなど7種類のオンライン会議アプリを比較する
4月23日にニコニコ生放送で配信された小岩井ことりさんのネットラジオ番組「ことりの音」をご覧になった方も多かったと思うが、筆者もリアルタイムに番組を見て、改めて、マニアックすぎる声優さんだと感じた次第。
自ら行なった実験結果をスペクトラムアナライザーで表示させつつ、詳細に解説していく声優番組って、かなり普通ではないな、と……。その番組を見れば、だいたいの結論は見えたと思うが、小岩井さん自身はどれがベストであるか、という断言はしていなかったし、情報量が多すぎて、消化しきれなかった人も多かったと思うので、復習の意味も込めて、ここでじっくり見ていく。
ここで実験したのは以下の7つのアプリだ。
- Skype
- LINE
- Zoom
- Discord
- Hangout
- Teams
- Cisco Webex Meetings
これらをLAN環境で動かし、予め録音しておいた音を伝送し、相手側から出てきた音を解析するという形。その予め録音しておいたオリジナルデータは下記の通り。
なお、各アプリにおいて設定パラメータもいろいろある。なるべくストレートに音を送るということを考えると、必ずしもデフォルトでの設定がベストというわけではないため、多少設定の変更を行なっている。
それぞれを簡単に説明すると、LINEでは「音量の自動設定」をオフにしている、Zoomも同様に「自動で音量調整」をオフにするとともに、詳細を設定すると3つのオーディオ処理項目があるので、「連続的な背景雑音の抑制」と「断続的な背景雑音の抑制」を無効化。「エコー除去」は無効という設定がなく、自動と強度のどちらかなので、ここでは自動を設定している。
Discordもいろいろ設定があるが、やはり「入力感度の自動調整」をオフ、ノイズ抑制系やエコー除去などもオフに、「誰かが話をしている際のレベル下げる」機能などもオフにしている。
HangaoutおよびTeamsはほとんど設定がないのでオーディオ入出力の設定をする程度、そしてCisco Webexは「音声を自動調整する」をオフにしている。
スペクトラムアナライザーで比較する
前述した設定をした上で実験し、スペクトラムアナライザーで分析した結果を一挙に紹介すると、前回紹介したSkypeも含め以下のようになっていた。
オリジナルと比較しながら、見てみると、いろいろな発見があると思うが、動画だと一覧しての比較がしにくいので、ホワイトノイズ部分だけをキャプチャして並べてみた。
こう見てみると、Skypeは低域も高域もバッサリ切り落としているのが見て取れる。やはり歴史ある通話ソフトだけに、通信速度が遅くてもしっかり会話を聴きとれるようバンド幅を狭くしていたということなのだろうか?
同じマイクロソフトのTeamsも、Skypeと同様に8.5kHz以上をカットしており、70Hz以下もゼロではないもののかなりカットした似た傾向だ。Cisco Webexは30Hzあたりが凹むやや妙な形ではあるが、基本的にはSkypeなどと似た感じになっている。
オンライン会議アプリの代名詞的にもなっているZoomは思っていたより優秀そうで、17k以上が切れているだけで、下のほうまでフラットに音が出ている。
さらに、絶対音が悪いという印象を持っていたLINEが意外なことに70Hz~20kHz以上までフラットに音が出ていることは、「ことりの音」の番組の中でも小岩井さんが指摘していた。これは普段使うスマホ環境ではなくPCのLINEであるということも大きく影響していそうだ。ただ、このLINEの結果ではオリジナルよりも音量が上がっているというのがポイントであり、この点は後ほど言及する。
GoogleのHangoutとゲーム系チャットツールとして人気のあるDiscordが似た傾向のグラフとなっている。ともに90Hzあたりから下が減衰してはいるものの、20kHz以上までフラットとなっていて、良さそうに見える。
波形エディタで時間軸に比較する
次に、これらを波形エディタで、横軸を時間軸にして見比べてみるとどうなるのだろうか? それがこちらだ。
「ことりの音」ではVegasを使ってオリジナル波形を含めすべてを並べて表示させていたが、ここではよりハッキリ見えるようにするため、Sound Forgeを使ってそれぞれ個別に表示させている。
見比べてみると、やはりSkypeは非常に特徴的で、声の部分が大きく持ち上げられている一方、ノイズ部分はその最適音量を判断するのに時間がかかるのかフェードインがかかったような波形になっている。
Skypeに似た特徴を持っているのがLINEで、LINEはさらにマキシマイザーを掛けたように大きく持ち上げてー4dBくらいまで潰すという処理をしているようだ。Teamsもノイズ部分にフェードインがかかったような形にはなっているが、声の部分は比較的オリジナルに近い波形となっている。
ユニークなのはCisco Webexで、声の部分はオリジナルに近いのだが、ノイズにおいてはホワイトノイズ、ピンクノイズ、ブラウニアンノイズともに約2秒経過したところで、音が消えているのだ。これはシステム側がノイズである、という判断をして、ノイズゲートを掛けたということなのだろうか……。
それに対し、Zoom、Discord、Hangoutはいずれもオリジナルとかなり近い波形となっており、あまり妙なダイナミックス調整は行なっていないように思える。
オーディオリペアツール「iZotope RX7」で表示比較する
波形から分かるのはこの程度かな……と思いつつ、先日の「ことりの音」を見ていたら、小岩井さんが面白い指摘をしていたのだ。
それはノイズの切れぎわにおいて、HangoutやSkype、Teams、Cisco Webexにおいては余韻が残るようにレベルがゆっくり下がるというのだ。普通に動画を見ていてもまったく気づかなかったのだが、動画を並べて比較すると確かに違いが見える。とくにHangoutにおいては、その動きが顕著だったのだが、これはどういうことなのだろう……と不思議に思っていたところ、翌日、視聴者の方が追試を行ないスペクトラム表示をさせた上で、小岩井さんに「エコーキャンセラーが効いているのではないか?」と伝えていたのだ。
そこで、こちらでも同様の状況が見えるのか、Hangoutに限らず、すべての結果をオーディオリペアツール「iZotope RX7」で表示させてみた。
まず問題のHangoutから見てみると、ノイズの後ろに赤と黄色の表示で残像のようなものが残っている。またノイズ成分がオリジナルと比較して薄いことからも分かる通り、確かにエコーキャンセラーが効いて残響音を消しているようなのだ。そして、その逆相成分がノイズが終わった後にもしばらく残っているのが、ゆっくり音が落ちる正体のようだ。
でもこのRXの色で見てみると、Hangout以外にもいろいろ妙な変化をしているのが分かってくる。当然高域も低域も削りとられているSkypeはだいぶ違う色になっているし、Cisco WebexやTeamsもSkypeに近い雰囲気だ。
LINEは高域まで出ているけれど、色が変わっており、音質に大きな変化が生じていることが見て取れる。それに対し、DiscordとZoomは、オリジナル音声を直接伝送できたこともあり、オリジナルと結構近い色、形状であることが分かる。このように表示方法を変えることで、いろいろな違いが見えてくるようだ。
今回の実験においては、トータル的に見てDiscordが優秀
今回の実験は理想的な環境で、しかも1対1での接続という、特殊な条件下で行なっているため、上記の結果が万能ではない。とくに複数人数での通信になると、利用できる通信の帯域が人数に反比例して狭くなり音質が落ちてくるため、ここでの結果とは大きく状況が変わる可能性もある。そのため、あくまでの一つの参考値として見ていただくのがいいだろう。
とはいえ、これらの結果から見えてくるのは低域は少し欠けているが、トータル的に見てDiscordが優秀であったということ。実際、筆者もいくつかを実践で試してみたところ、感覚的にもDiscordの音はクリアで、扱いやすかったことから、先日のDTMステーションPlus! の放送においてもDiscordを使ってみたのだ。まだまだ試行錯誤の状況ではあるが、オンライン会議アプリで接続した状況を放送するとしたらどうするのがベストなのか、もう少し探ってみたいと思っている。
なお、これら実験が終わった後、小岩井さんや「ことりの音」のスタッフメンバーとオンラインで話をしていたのだが、オンライン会議システムの音質比較だけでなく、ほかにもいろいろと面白いオーディオ実験のアイディアが上がってきた。機会があれば、また小岩井さんと組んで、面白い実験記事を作ってみたいと思っているところだ。