“Zooma!:ズームレンズ、ズームすること、ズームする人、ズズーンの造語” |
■ ファイルが読めるだけじゃあ…
AVCHDのネイティブ編集ができると言うソフトウェアは、まあまあある。しかしそういうものを紹介していて辛いなーと思うのが、それらは直接ファイルが読めて操作ができるのだが、リアルタイムでの再生ができない。再生して映像が見られないのだから、当然編集結果のタイミングも見られない。それを以て、「編集」と言えるのか。
AVCHDをリアルタイムで再生可能にするためには、編集用のコーデックに変換するというのが一般的であった。トムソン・カノープスのEDIUSシリーズであればCanopus HQ Codecに、アップルFinal Cut ProであればProRes 422に変換すれば、リアルタイム再生でき、ネイティブファイルと遜色ない画質で編集が可能である。
しかしその変換する時間が勿体ない。さすがにこの変換は、ソフトウェアだけでは実時間とはいかない。そのためトムソン・カノープスではFIRECODER Bluというアクセラレータボードを用意しているし、アップル関連では収録時に最初からProRes 422で撮るフィールドレコーダが各種登場している。
ただコンシューマでは、専用のハードウェアを用意してまでスピードが必要なケースは少ないだろう。できればソフトウェアだけで手早い編集が可能になれば、それに越したことはないのである。
先日発表されたトムソン・カノープスの「EDIUS Neo 2 Booster」(以下Neo2B)は、AVCHDのデコーダを新たに開発し、ソフトウェアだけでAVCHDをネイティブに編集できるようにした製品だ。従来のEDIUS Neo 2でも、AVCHDを直接読み込むことはできたが、リアルタイムでの再生はできなかった。しかし今回は、CPUのマルチスレッドを上手く使うことでリアルタイム再生を可能にしたわけである。
編集機能としては特に新しくなったところはないが、ソフトウェアのみで変換無しにダイレクトで編集に取りかかれるというのは、大きなメリットだ。ではさっそくそのパフォーマンスをテストしてみよう。
■ マルチスレッドを再生時に使う
今回使用したマシンは、CPUがIntel Core2 Quad Q6600/2.4GHz、メモリ2GBのWindows 7マシンである。あいにくWindows 7は明日発売なのでまだ正規版ではなく、今年5月に公開されたビルド7100の64bitバージョンを使用している。
今回搭載されたAVCHDデコーダは、映像ストリームをGOP単位に分けてCPUのスレッドへ投げることで、高速なデコード処理を可能にした。CPUパフォーマンスと再生ストリーム数の関係は、以下のようになっている。
CPU | 同時再生ストリーム数 | 対応解像度 |
Core i7 | 3以上 | 1,920×1,080 |
Core 2 Quad | 1以上 | 1,920×1,080 |
Core 2 Duo | 1以上 | 1,440×1,080 |
現在ノートPCを始め一般的に搭載されているCore 2 Duoでは、フルHD解像度のストリームは再生できない。AVCHDでも低画質モードか、720pでの撮影ではなんとか、というぐらいだ。今回のテスト機であるCore 2 Quadでも、ようやくフルHDが1ストリームである。ただトランジションエフェクトやPinPなどを使用すれば、一時的に2ストリーム再生となるところが問題なのである。
各素材で同じような編集を行ない、再生パフォーマンスを比較した |
では早速各社のAVCHDカメラで撮影したファイルでのパフォーマンスを見てみよう。行なった編集は、1ストリーム再生から2ストリーム目をPinP、その後CPUの3Dトランジションエフェクトを使ったのち、GPUの3Dトランジションエフェクトを使用するというものである。これを再生し、各エフェクトブロックでのリアルタイム再生の可否を計測した。また参考までにCPUの利用率も調べてみた。
メーカー | カメラ | 2レイヤー (PinP) | CPU-EFF | GPU-EFF | CPU |
SONY | HDR-CX520V | × | × | ○ | |
Panasonic | HDC-TM350 | × | ○ | ○ | |
Victor | GZ-HM400 | × | ○ | ○ | |
Canon | HF S11 | × | ○ | ○ | |
Panasonic | DMC-TZ7(720p) | ○ | ○ | ○ | |
Panasonic | PHモードサンプル | ○ | ○ | ○ |
結果を見ると、同じAVCHDフォーマットとはいえ実は微妙にGOPの構成が異なり、パフォーマンスには若干の違いが出るようだ。ソニーはGOPの構造が他社とは違うようで、常時かなりのCPUパワーが必要となる。パナソニック、キヤノンはあまり負荷が高くなく、短い間であれば2ストリームでもコマ落ちなく再生できる。
Panasonic「DMC-TZ7」で撮影したAVCHD Liteは720pだが、かなりパフォーマンスに余裕がある。実験機でも3ストリームのリアルタイム再生まで可能だった。
またZooma! ではカメラのレビューを行なっていないが、パナソニックの業務用カムコーダAVCCAMで搭載された24Mbps(平均21Mbps)のPHモードのサンプルファイルでもテストしてみた。このモードでは、マルチスライスという手法で、マルチコアCPUへの対応を行なっている。これには詳細な資料がなく伝聞ではあるが、マルチコアに分けやすいよう、GOP単位でクローズにするなどの処理が行なわれているそうである。Neo2BでもこのPHモードに対応しており、再生効率は良い。CPU負荷はそれなりに高いが、2ストリームでもひっかかることなく再生できた。
AVCHDがネイティブで編集できれば、出力もスマートレンダリングでお願いしたいところだが、残念ながらNeo2Bはスマートレンダリング出力には対応していない。バンドルソフトのように、扱うファイルが1メーカーのカメラ1種類という前提であれば可能なのだろうが、マルチフォーマットに対応したソフトウェアでは難しいようだ。
■ 音声合成もここまで来た
すでに今年7月から販売されているが、今回はEDIUS用のオプションとして販売されている「声の職人 for EDIUS」のフルバージョンもお借りしている。これまでテストする機会がなかったので、こちらも試してみよう。
「声の職人 for EDIUS」は単体のアプリケーションというわけではなく、EDIUSのメニューの「キャプチャ」から呼び出す格好になっている。GUIの感じは全然違うが、一種のプラグインのような扱いになっている。
使い方は簡単で、ウインドウにしゃべらせたいテキストを入力し、再生ボタンを押すだけである。問題なくしゃべれたのを確認したら、「保存」ボタンを押す。するとEDIUSのBIN内に、WAVファイルとして音声ファイルが書き出されるという仕組みである。
メニューの「キャプチャ」から呼び出す | ウインドウにテキストを入力するだけでナレーションの作成が可能 |
voice.mpg(31.1MB) |
「声の職人」5人に同じフレーズをしゃべらせてみた |
編集部注:編集部では掲載した動画の再生の保証はいたしかねます。また、再生環境についての個別のご質問にはお答えいたしかねますのでご了承下さい。 |
公式には6人の話者がいるそうだが、for EDIUS版では標準の「あかり」のほか、4人のオプションデータがある。それぞれにしゃべらせてみた。
話者によっては合成っぽい感じもあるが、滑舌良く、はっきり聞こえるというメリットがある。ビデオのナレーターとして利用するというよりも、ものすごい数のバリエーションの音声ガイドが必要とか、そういった用途で活躍しそうだ。現在は地方自治体などでの引き合いが多く、防災放送や問い合わせ電話の自動応答音声などで活躍しているそうである。
子どもの声を何に使うのかというと、これは動物のアテレコに使うとイイ感じになる。通常子役のナレ撮りをするのはものすごく大変で時間もかかるのだが、これならば時間もかからず、部分的な言葉の差し替えも簡単である。
フルバージョンではイントネーションの修正も可能 |
これらの声データは、実際に本物の話者から4時間ほどサンプルの朗読データを取り、母音・子音などに要素を分解するのだそうである。ちなみに「あんず」と「こうたろう」がなんとなく関西なまりっぽいのは、サンプルの子どもが関西の子だったからだそうである。
なおフルバージョンでは、イントネーションもある程度操作することができる。自動認識では発音しにくい語句があった場合は、自分でイントネーションを直して辞書登録することができる。それ以降は同じ語句が出てくると、辞書登録したイントネーションが使用される。
■ 総論
今回のアップデートでは編集機能が追加されたわけではないので、なーんだ感はあるかもしれないが、事実上EDIUS Neo 2のWindows 7公式対応版という位置づけとも言える。今回は64bit版で動かしてみたが、特に問題なく動作している。
なにしろ撮影した映像を取り込みや変換操作なしに、カメラやメディアをPCに繋いでどんどこ編集していけるというのは、プロの世界ではP2やXDCAM EXで実績があるが、コンシューマの世界では珍しい。マシンパワーが相当必要な点は今後の課題だが、Core i7も11月には廉価ラインナップとなる8xxシリーズがリリースされ、マシンの価格も下がることだろう。
実際の編集では、比較・合成などがメインでなければ、2ストリーム以上の同時再生を頻繁に使うということはあまりないだろう。トランジションもGPUエフェクトを使えばリアルタイムでこなせるので、カット編集にスーパーインポーズがメインの編集であれば、Core 2 Quadマシンでも十分こなせる。
また音声合成技術は昨今大幅に進歩してきたこともあり、もはや歌わせるぐらいのことには大した違和感が無くなってきているご時世である。「声の職人」も、以前の合成ソフトのような細かいチューニングを必要とせず、そこそこ問題なくしゃべってくれるぐらいのクオリティを持っている。ただ歌と違ってナレーションの場合は、自然なイントネーション以外にも、自然な音の連結も重要な要素である。音の連結が不自然な部分は、別の言い回しにナレーション原稿を変えるといった工夫も必要だろう。
なおパナソニックのAVCCAMシリーズには、EDIUS Neo 2がバンドルされてきたが、今後は徐々にNeo2Bに変わっていくそうである。少しずつではあるが、ようやく本当の意味でのAVCHDネイティブ編集と呼べるところまで来た。
かつてDVフォーマットが登場した時も、'95年から'97年ぐらいで撮影イノベーションが起こり、その後PCの進化によって編集イノベーションの時代を迎えた。'09年~'10年はいよいよ舞台をAVCHDに移して、撮影から編集へのイノベーションが転換する年なのかもしれない。