藤本健のDigital Audio Laboratory

第848回

最も音が良い会議アプリは? 声優・小岩井ことりさんと音質比較してみた 後編

声優の小岩井ことりさん

テレワークにおけるミーティングでも、大学をはじめとする学校の授業でも、そして飲み会でも活用されているオンライン会議アプリ。

ZoomやSkype、Teamsといったアプリがあるおかげで、自宅に居ながらにして快適にコミュニケーションが取れるのはいいのだが、その通信において映像の質や音質が悪いと、コミュニケーションの質も落ちてしまう。とくに音質の良し悪しは、そのやりとりにおいて大きな影響を与えるが、どのオンライン会議アプリがいいのだろうか?

もちろん、どれがいいかは会議の目的にもよるだろうし、通信回線によっても変わってくる。また、PCを使うのかスマホを使うのか、内蔵マイク・スピーカーで行なうのか、オーディオインターフェイスを利用するのか……などなど条件によって変わってくるので一概に言えない。

そうした中、理想的な通信環境・オーディオ環境があった場合、どのアプリが最も音質に優れるか、先日声優の小岩井ことりさんとともに、実験を行なってみた。正確には小岩井さんの実験結果に相乗りさせてもらったという感じではあるが、その実験手法については前回の記事で紹介した通りだ。

今回はその実験を行なった結果、具体的に7つのオンライン会議アプリで、どのように音に違いがあるのか、小岩井さんのデータを詳しく見ながらチェックしていくことにしよう。

Skype、LINE、Zoomなど7種類のオンライン会議アプリを比較する

4月23日にニコニコ生放送で配信された小岩井ことりさんのネットラジオ番組「ことりの音」をご覧になった方も多かったと思うが、筆者もリアルタイムに番組を見て、改めて、マニアックすぎる声優さんだと感じた次第。

小岩井ことりさんのネットラジオ番組「ことりの音

自ら行なった実験結果をスペクトラムアナライザーで表示させつつ、詳細に解説していく声優番組って、かなり普通ではないな、と……。その番組を見れば、だいたいの結論は見えたと思うが、小岩井さん自身はどれがベストであるか、という断言はしていなかったし、情報量が多すぎて、消化しきれなかった人も多かったと思うので、復習の意味も込めて、ここでじっくり見ていく。

ここで実験したのは以下の7つのアプリだ。

  • Skype
  • LINE
  • Zoom
  • Discord
  • Hangout
  • Teams
  • Cisco Webex Meetings

これらをLAN環境で動かし、予め録音しておいた音を伝送し、相手側から出てきた音を解析するという形。その予め録音しておいたオリジナルデータは下記の通り。

会議アプリ比較 オリジナル

なお、各アプリにおいて設定パラメータもいろいろある。なるべくストレートに音を送るということを考えると、必ずしもデフォルトでの設定がベストというわけではないため、多少設定の変更を行なっている。

それぞれを簡単に説明すると、LINEでは「音量の自動設定」をオフにしている、Zoomも同様に「自動で音量調整」をオフにするとともに、詳細を設定すると3つのオーディオ処理項目があるので、「連続的な背景雑音の抑制」と「断続的な背景雑音の抑制」を無効化。「エコー除去」は無効という設定がなく、自動と強度のどちらかなので、ここでは自動を設定している。

実験に際し、アプリ毎に設定の微調整を行なっている。LINEでは「音量の自動設定」をオフに変更
Zoomも「自動で音量調整」をオフに設定
「エコー除去」は自動を設定

Discordもいろいろ設定があるが、やはり「入力感度の自動調整」をオフ、ノイズ抑制系やエコー除去などもオフに、「誰かが話をしている際のレベル下げる」機能などもオフにしている。

Discordも「入力感度の自動調整」をオフ
ノイズ抑制系やエコー除去なども設定オフ
「誰かが話をしている際のレベル下げる」機能などもオフとした

HangaoutおよびTeamsはほとんど設定がないのでオーディオ入出力の設定をする程度、そしてCisco Webexは「音声を自動調整する」をオフにしている。

HangoutとTeamsはオーディオ入出力の設定を調整
Cisco Webexは「音声を自動調整する」をオフ

スペクトラムアナライザーで比較する

前述した設定をした上で実験し、スペクトラムアナライザーで分析した結果を一挙に紹介すると、前回紹介したSkypeも含め以下のようになっていた。

会議アプリ比較 Skype
会議アプリ比較 LINE
会議アプリ比較 Zoom
会議アプリ比較 Discord
会議アプリ比較 Hangout
会議アプリ比較 Teams
会議アプリ比較 Cisco Webex Meetings

オリジナルと比較しながら、見てみると、いろいろな発見があると思うが、動画だと一覧しての比較がしにくいので、ホワイトノイズ部分だけをキャプチャして並べてみた。

オリジナル
Skype
LINE
Zoom
Discord
Hangout
Teams
Cisco Webex Meetings

こう見てみると、Skypeは低域も高域もバッサリ切り落としているのが見て取れる。やはり歴史ある通話ソフトだけに、通信速度が遅くてもしっかり会話を聴きとれるようバンド幅を狭くしていたということなのだろうか?

同じマイクロソフトのTeamsも、Skypeと同様に8.5kHz以上をカットしており、70Hz以下もゼロではないもののかなりカットした似た傾向だ。Cisco Webexは30Hzあたりが凹むやや妙な形ではあるが、基本的にはSkypeなどと似た感じになっている。

オンライン会議アプリの代名詞的にもなっているZoomは思っていたより優秀そうで、17k以上が切れているだけで、下のほうまでフラットに音が出ている。

さらに、絶対音が悪いという印象を持っていたLINEが意外なことに70Hz~20kHz以上までフラットに音が出ていることは、「ことりの音」の番組の中でも小岩井さんが指摘していた。これは普段使うスマホ環境ではなくPCのLINEであるということも大きく影響していそうだ。ただ、このLINEの結果ではオリジナルよりも音量が上がっているというのがポイントであり、この点は後ほど言及する。

GoogleのHangoutとゲーム系チャットツールとして人気のあるDiscordが似た傾向のグラフとなっている。ともに90Hzあたりから下が減衰してはいるものの、20kHz以上までフラットとなっていて、良さそうに見える。

LINEが70Hz~20kHz以上までフラットに音が出ていることは、「ことりの音」の番組の中でも小岩井さんが指摘していた

波形エディタで時間軸に比較する

次に、これらを波形エディタで、横軸を時間軸にして見比べてみるとどうなるのだろうか? それがこちらだ。

オリジナル
Skype
LINE
Zoom
Discord
Hangout
Teams
Cisco Webex Meetings

「ことりの音」ではVegasを使ってオリジナル波形を含めすべてを並べて表示させていたが、ここではよりハッキリ見えるようにするため、Sound Forgeを使ってそれぞれ個別に表示させている。

「ことりの音」ではVegasを使ってオリジナル波形を含めすべてを並べて表示させていた

見比べてみると、やはりSkypeは非常に特徴的で、声の部分が大きく持ち上げられている一方、ノイズ部分はその最適音量を判断するのに時間がかかるのかフェードインがかかったような波形になっている。

Skypeに似た特徴を持っているのがLINEで、LINEはさらにマキシマイザーを掛けたように大きく持ち上げてー4dBくらいまで潰すという処理をしているようだ。Teamsもノイズ部分にフェードインがかかったような形にはなっているが、声の部分は比較的オリジナルに近い波形となっている。

ユニークなのはCisco Webexで、声の部分はオリジナルに近いのだが、ノイズにおいてはホワイトノイズ、ピンクノイズ、ブラウニアンノイズともに約2秒経過したところで、音が消えているのだ。これはシステム側がノイズである、という判断をして、ノイズゲートを掛けたということなのだろうか……。

それに対し、Zoom、Discord、Hangoutはいずれもオリジナルとかなり近い波形となっており、あまり妙なダイナミックス調整は行なっていないように思える。

オーディオリペアツール「iZotope RX7」で表示比較する

波形から分かるのはこの程度かな……と思いつつ、先日の「ことりの音」を見ていたら、小岩井さんが面白い指摘をしていたのだ。

それはノイズの切れぎわにおいて、HangoutやSkype、Teams、Cisco Webexにおいては余韻が残るようにレベルがゆっくり下がるというのだ。普通に動画を見ていてもまったく気づかなかったのだが、動画を並べて比較すると確かに違いが見える。とくにHangoutにおいては、その動きが顕著だったのだが、これはどういうことなのだろう……と不思議に思っていたところ、翌日、視聴者の方が追試を行ないスペクトラム表示をさせた上で、小岩井さんに「エコーキャンセラーが効いているのではないか?」と伝えていたのだ。

そこで、こちらでも同様の状況が見えるのか、Hangoutに限らず、すべての結果をオーディオリペアツール「iZotope RX7」で表示させてみた。

オリジナル
Skype
LINE
Zoom
Discord
Hangout
Teams
Cisco Webex Meetings

まず問題のHangoutから見てみると、ノイズの後ろに赤と黄色の表示で残像のようなものが残っている。またノイズ成分がオリジナルと比較して薄いことからも分かる通り、確かにエコーキャンセラーが効いて残響音を消しているようなのだ。そして、その逆相成分がノイズが終わった後にもしばらく残っているのが、ゆっくり音が落ちる正体のようだ。

でもこのRXの色で見てみると、Hangout以外にもいろいろ妙な変化をしているのが分かってくる。当然高域も低域も削りとられているSkypeはだいぶ違う色になっているし、Cisco WebexやTeamsもSkypeに近い雰囲気だ。

LINEは高域まで出ているけれど、色が変わっており、音質に大きな変化が生じていることが見て取れる。それに対し、DiscordとZoomは、オリジナル音声を直接伝送できたこともあり、オリジナルと結構近い色、形状であることが分かる。このように表示方法を変えることで、いろいろな違いが見えてくるようだ。

今回の実験においては、トータル的に見てDiscordが優秀

今回の実験は理想的な環境で、しかも1対1での接続という、特殊な条件下で行なっているため、上記の結果が万能ではない。とくに複数人数での通信になると、利用できる通信の帯域が人数に反比例して狭くなり音質が落ちてくるため、ここでの結果とは大きく状況が変わる可能性もある。そのため、あくまでの一つの参考値として見ていただくのがいいだろう。

とはいえ、これらの結果から見えてくるのは低域は少し欠けているが、トータル的に見てDiscordが優秀であったということ。実際、筆者もいくつかを実践で試してみたところ、感覚的にもDiscordの音はクリアで、扱いやすかったことから、先日のDTMステーションPlus! の放送においてもDiscordを使ってみたのだ。まだまだ試行錯誤の状況ではあるが、オンライン会議アプリで接続した状況を放送するとしたらどうするのがベストなのか、もう少し探ってみたいと思っている。

なお、これら実験が終わった後、小岩井さんや「ことりの音」のスタッフメンバーとオンラインで話をしていたのだが、オンライン会議システムの音質比較だけでなく、ほかにもいろいろと面白いオーディオ実験のアイディアが上がってきた。機会があれば、また小岩井さんと組んで、面白い実験記事を作ってみたいと思っているところだ。

藤本健

 リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。  著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。Twitterは@kenfujimoto