藤本健のDigital Audio Laboratory

第936回

NVIDIAより強力!? 3,960円のノイズ除去プラグイン「Clarity Vx」を試す

Waves Audioのプラグイン「Clarity Vx」

先日、「NVIDIA Broadcast」というNVIDIA提供の無料ソフトを利用したノイズ除去についてレポートした(記事参照)。同ソフトは無料とはいえ、NVIDIAのそこそこハイスペックなGPUを搭載したPCを使わなければならないが、同様のリアルタイムノイズ除去をCPUパワーで行なうソフトが先日話題を集めた。それが、イスラエルのWaves Audioが開発した「Clarity Vx」というプラグインだ。

現在、発売記念プライスとして3,960円という手ごろな価格で販売されていたので、NVIDIA Broadcastと比較してどのくらいの差があるのか試してみた。その結果、おそらくClarity Vxのほうが優秀と思われる性能であることが分かった。ただ、使い勝手で気になる点もあったので、合わせてレポートしていこう。

強力なノイズ除去性能。NVIDIA Broadcastよりも声質変化が少ない

イスラエルのソフトというと、軍需系ソフト? と思う方も少なくないと思うが、WavesはDTMをある程度経験ある方なら知らない人はいないほど、著名な音楽制作専業のメーカーである。コンプレッサやマキシマイザ、イコライザほか、数多くのエフェクトプラグインを開発するメーカーであり、プロからアマチュアまで数多くのユーザーが利用している。国内ではメディア・インテグレーションが輸入代理店をしている。

さまざまなエフェクトプラグインをラインナップする

そのWavesが先日発売したのが、冒頭で紹介した「Clarity Vx」と、その上位版の「Clarity Vx Pro」だ。メディア・インテグレーションの情報を見ると、通常価格はそれぞれ19,030円、101,970円と、結構な価格なのだが、現在発売記念のイントロプライスということで3,960円(79% OFF)、32,868円(68% OFF)で提供されている。Wavesによると、Clarity VxとClarity Vx Proの違いは機能の有無であり、ノイズ除去の性能に関しては「まったく同じである」という。

上位版の「Clarity Vx Pro」

そこで、まずは安価なClarity Vxを中心に使っていく。

最初に、先日NVIDIA Broadcastで行なった実験と同じヘアドライヤーを用いたノイズ除去を試してみた。とりあえず、以下の動画をご覧いただきたい。

Waves Clarity Vxオーディオ・ノイズリダクションテスト1

いかがだろうか? ドライヤーをオンにすると、声が盛大なノイズに埋もれてしまうのだが、ノブを0の状態から少しずつ回していくと、声質はほとんど変わらず、ノイズだけが消えていくのがお分かり頂けるだろう。

ノブを真上の50%程度のところに持っていくと、ノイズの大半は抑え込まれている。もちろん、この状態でドライヤーを遠ざけたりしているわけではなく、ドライヤーの音量は一定だ。ただ、ヘッドフォンで聴くと、50%の状態ではまだノイズの音は認識でき、70%、80%、90%と上げていくとノイズは消えていくが、まったく聴こえないわけではない。

約70%の状態

しかし100%にすると、ノイズは完全に消え去り、声が出ていない部分では完全に無音。この時でもNVIDIA Broadcastのときのような声質の劣化はあまりなく、かなり原音に近いまま残っている。ノブを元の状態に戻していくと、またドライヤーの音が聴こえてきて、0まで持ってくると声が完全に埋もれてしまうこともわかるはず。ここまでキレイに除去できるのは驚きだ。

続いて、ドライヤーではなく、マイクのそばでiPhoneから音楽を鳴らしながらしゃべってみたらどうなるか。その実験が以下のビデオだ。

Waves Clarity Vxオーディオ・ノイズリダクションテスト2

ドライヤーの場合は比較的単純なホワイトノイズに近い音だったが、より複雑なノイズと思われる音楽に変えても、ほぼ同様の効果が得られているのがわかるだろう。

AIパワーでリアルタイムにノイズを除去する

どのような実験を行なったのか、少し解説していこう。

Clarity Vxはプラグインで動作するソフトであり、リアルタイム処理を可能にするもの。まさに入ってきた音に同ソフトを通して出すと、ノイズが消えるフィルターとして機能する。

動作環境としてはWindowsのVST2、VST3、AAX、そしてMacのVST2、VST3、AAX、AudioUnitsのそれぞれで動く。これらが利用できるDAWに組み込んで使うことで、リアルタイムに入ってくるマイク入力をその場でノイズレスにすることができる。先日のNVIDIA Broadcastと異なり、スタンドアロンで動くわけではなく、あくまでもプラグインとして使うためホストアプリが必要だ。

実験には、Cubaseを使用した

今回はWindows上のCubaseで使っているが、リアルタイムでの動作とはいえ、処理時間に10msec程度は要するようだ。

実際、オーディオインターフェイスのバッファサイズを16 Sampleや32 Sampleなどの設定にすると、うまく機能せず、逆にブチブチといったノイズが追加されてしまう。そこで、実験では48kHzのサンプリングレート、512サンプルとやや大きめのバッファサイズとしている。入力音をモニターすると、20msec程度のディレイがかかった状態で自分の声が聴こえるが、この程度であればほとんど違和感はない。

実験では48kHzのサンプリングレート、512サンプルとした

先ほどのビデオからもわかる通り、ワンノブで操作できるのが非常にわかりやすく、50%程度まで上げれば、大半のノイズは抑え込むことができる。徹底的にノイズを消すのであれば、100%に設定するのがいいのだろうが、やはりある程度は声質にも影響を与えるため、50%程度での運用がお薦めだ。

先ほどの“ドライヤー”と“音楽”のノイズ除去実験で変更していたのがNEURAL NETWORK設定。ドライヤーでは「Broad 1」としていたが、音楽では「Broad 2」としている。

音楽では、NEURAL NETWORK設定を「Broad 2」にしている

Wavesの説明によると、Broad 1は「複数の音声が録音されている場合、主音声と副音声の両方を保存するのに適しています」とあり、Broad 2は「ノイズがひどい場合は、また、複数の音声が録音されている場合、主音声と副音声を分離するのに適しています」と記載されていた。

当初は音楽でも、Broad 1で行なったのだが、若干ノイズ除去の具合が十分でなかったため、Broad 2に変えたところ、より効果的にノイズを取ることができた。

ただ、このBroad 2の場合でも、100%にすると、声の切れ際などに若干音楽が入り込むのが分かる。やはり完全分離ができないケースがある、ということなのだろう。そのため、完全にシャットアウトさせるより、50%かせいぜい80%程度に留めておくのが効果的と思う。

では、なぜここまでキレイにノイズと声を分離できるのかというと、周波数帯でフィルタリングする従来の仕組みではなく、AI技術を利用しているからだ。AIの活用という点では、NVIDIA Broadcastと共通するが、Wavesでは「Waves Neural Networksエンジン」というものを使い、何がボイスで、何がノイズなのかを深層学習で理解させているという。

具体的には「何十万ものボーカル録音のオーディオファイルを供給され、機械学習と細心の注意を払った人間の評価を組み合わせて、ボイスとアンビエンスの違いを認識するように訓練されている」とのこと。従来のノイズリダクションは、ノイズとともに原音も削り取られるため、ノイズを取れば取るほど原音の劣化が激しいが、Clarity VxはAI技術を活用することで、ノイズを除去しながらも原音を維持しているわけだ。

上位バージョン「Clarity Vx Pro」も試す

前述した通り、上位バージョンとして「Clarity Vx Pro」が存在するが、これは何が違うのだろうか。

下記の写真がメイン画面なのだが、Clarity Vxと違い、少し複雑になっている。画面上部にはFFTが表示されており、声の部分と、ノイズの部分が分離される形で表示されている。

「Clarity Vx Pro」のメイン画面

基本的な使い方はClarity Vxと同じで、画面下中央のノブを回していくだけだが、真上に向けた状態がClarity Vxでいう0%の状態になっていて、右に回していくとClarity Vxと同じ動作をする。反対に左に回していくと、声が消え、ノイズというかアンビエンス成分だけが聞こえるようになる。つまり、先ほどの例でいうと、ドライヤーの音だけを取り出したいとか、音楽だけを取り出したい場合は左にノブを回していけばいいのだ。

アンビエンス成分だけを聞こえるようにした状態

さらに画面下にある「ADVANCED CONTROL」というボタンをオンにすると、上のFFT画面が4バンドに分割され、下部にいくつかのパラメータが表示される。4バンドのほうは、周波数帯ごとの処理する/しない、どのくらい強く処理するか、といった設定ができ、そのバンド幅を調整することもできる。まさに従来からの手法を重ね合わせることで、より効果的に使おうというものなのだ。

「ADVANCED CONTROL」ボタンをオンにした状態

ほかにも、反射音に対する効果を調整する「REFLECTIONS」、各バンドごとにどのくらいかけるかを調整する「PROCESS AMOUT」、アンビエンスを完全にシャットアウトする際に利用する「AMBIENCE GATE」などが用意されている。各種パラメータを追い込んでいく場合は、Clarity Vx Proがよさそうだが、ライトに利用するのであれば、Clarity Vxで十分のような気もする。

Clarity VxはDAW利用が必須。OBSでの利用ができない

ところで、こうしたノイズリダクションは、さまざまなシーンで利用できるが、やはりネット配信などで利用したい、という人は多いだろう。VST2プラグインで使えるので、OBSで利用できるのでは? と思ったのだが、結論からいうと、直接は利用できなかった。

実はWavesのプラグインはすべてライセンス管理されているため、一般的なVST2プラグインと扱いが違うのだ。Windowsであればdllファイル、MacであればvstファイルがVST2プラグインの本体プログラムとなるのだが、WavesのプラグインはどれでもWavesShell-VSTというファイル名になっており、これを経由して各プラグインを動作させる仕組みとなっている。ところがOBSはこれを使うことができず、動作しないのだ。

WavesShell-VSTというファイル名になっている

裏ワザがないかといろいろ試してみたものの、どうも無理そう。先ほどの実験映像はCubase Pro 12でリアルタイムに動かしたものなので、やはりVSTホストの問題と思われる。

となると、やはり間にDAWを介すしか方法はなさそうだ。ちょっと接続が煩雑にはなるが、2台のPCを使うか、2つのオーディオインターフェイスを接続するか、またWindowsであれば以前紹介したバーチャルドライバ「Voice Meeter Banana」を使うことで連携させることができる。Voice Meeter Bananaは、いろいろなことができるソフトであるだけに、接続がやや煩雑にはなるが、ハードウェアコストをかけずに使えるという面では大きなメリットがあるだろう。

接続がやや煩雑になるものの、バーチャルドライバ「Voice Meeter Banana」を使うことで連携させることができる

以上、Waves Audioのリアルタイム・ノイズリダクション「Clarity Vx」を取り上げたが、いかがだっただろうか。プラグインで、かつDAWをホストにしないと使えないという制約はあるものの、非常に効果的なソフトなので、使ってみる価値は高いと思う。

藤本健

 リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。  著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。Twitterは@kenfujimoto