~ 「ミュージックソムリエ」を試す ~ |
激しい | ←→ | 穏やかな |
躍動的 | ←→ | 落ち着いた |
爽やかな | ←→ | 不快な |
素朴な | ←→ | 飾り気な |
ソフトな | ←→ | ハードな |
印象マップ |
この5つをSD(Semantic Differential)法に基づいて7段階の絶対評価を行ない、それを最終的に2次元のマップに落としたものが、ミュージックソムリエで用いられている印象マップだ。
一方、オーディオ信号から抽出する音楽的特徴量は大きく2段階で捉えている。まず一段階目はサビ区間の検出。つまり、1曲を代表する区間はもっとも盛り上がっている部分であるサビにあると仮定し、それを見つけ出す。サビの始端から20秒の区間での音楽的特徴量を算出する。
2段階目は、オーディオ信号の物理的な特徴を8つのパラメータで分析する。
パラメータ名 | 物理的内容 | 関連する表現(例) |
---|---|---|
テンポ | 楽曲のテンポ | 激しさ、軽快さ |
ビート白色性 | テンポの揺らぎ | 人間っぽさ、荒っぽさ |
基本ビート | リズムパターン | 素朴さ |
ビート強度1 | 8分音符単位のアクセントの強さ | 躍動感 |
ビート強度2 | 16分音符単位のアクセントの強さ | 洗練さ |
ビート強度比 | 8分音符と16分音符の割合 | うるささ |
平均音数 | 発音数 | 落ち着き感 |
スペクトル変化度 | 音色変化 | きらびやかな |
曲の印象 |
その結果、「人が曲を聞いたときの印象」と「オーディオ信号の特徴量」を結びつけ、印象マップ上で表現し、レコメンドするというのがミュージックソムリエなのだ。
具体的には、「ウキウキ系」、「切ない感じ」、「ノリノリ系」、「癒し系」といった言葉で曲を表現する。
■ ミュージックソムリエの実力は?
SD-Jukebox 4.0 |
SD-Jukebox 4.0は、基本的にはごく一般的なジュークボックスソフトで、CDをドライブにセットするとCDDBに接続し、WMA、MP3、AACなどにエンコードできる。
すでにデータ化されているものでも、インポート可能。この際、ミュージックソムリエに登録するかどうかの設定も行なえるが、これをオンにした場合でも1曲につき3秒程度でインポートできた。ミュージックソムリエの解析エンジン自体は、かなり高速のものに仕上がっているようだ。
WMA、MP3、AACへのエンコードに対応 | オーディオデータのインポートも可能 | データインポートは比較的高速 |
5つの異なるジャンルのアルバムをミュージックソムリエに登録 |
実際、このようにしてミュージックソムリエに登録した結果どのようになるのか、手元にあった5つの異なるジャンルのアルバムを入れてみた。
Beatlesのベストナンバーが入った「1」、オルゴール的なサウンドのクリスマスソングのアルバム、(癒し系?)の女子十二楽坊の「Beautiful Energy」、ポップス・ロック系ではDavid Bowieの「Reality」、クラシックはチャイコフスキーの「ピアノ協奏曲第1番」や「組曲くるみ割り人形」などを収録したベスト盤を取り込んだ。
それなりに違うジャンルのものと思って入れたのだが、このマップを見ると、やや偏った形で分類されていた。
まず「癒し系」を選択すると、これを癒し系というのかどうかはともかくとして、チャイコフスキーの曲はいずれも近い位置にあるようだった。
一方、「ゆったり系」を選ぶとやや意外な結果になった。「Let it be」と「Hey Jude」が近いのはいいとして、「Jingle Bell」も「Ave Maria」も同じジャンルかといわれると、ちょっと抵抗も感じるが、聞いてみると確かにいずれもテンポは近いし、「ゆったり系」であることは確かではあった。
「癒し系」の選択結果 | 「ゆったり系」の選択結果 |
このデータベースが膨大になってくると、もっと面白い世界が構築できそうだ。
■ SDK外販による対応機器の拡大に期待
この機能がSD-Jukeboxだけの機能とすると、それほどの普及は期待できないが、松下電器は開発キットを「ソムリエSDK」という名称で外販することになった。
「ソムリエSDK」には、PCソフト用(V1.2-PC)と組込み用(V1.2-EB)の2種類が用意される。PC用はミュージックソムリエの基本機能に加え、ソムリエDB(印象値)登録管理機能、印象選曲機能(プリセット語数7種)、類似曲検索機能を備えている。対応OSは、Windows 98 SE/Me/2000/XP。モジュールサイズはインテルのIPPライブラリを含め約25MBになるという。
一方の組み込み用はCPUが日立のSH4以上、OSはμITRON。またモジュールサイズはSH4の場合で約300KB。必要RAMサイズは約500KBとのことだ。いずれの場合でも入力形式はリニアPCMデータ(サンプリングレート22.05/32/44.1/48KHz、ステレオ/モノラル)に対応しており、MP3などの圧縮データは、リニアPCM形式にデコードして利用することが前提となる。
これを松下電器が自ら販売するのは当然として、面白いのは前出のAgentArtsの国内総代理店であるレインボー・パートナーズが総代理店として入ったこと。同社は、もともとGracenoteの国内総代理店としてCDDBを多くのカーオーディオメーカーやAV機器メーカー、ソフトハウスに販売してきた実績があるだけに、これらの企業へ普及する可能性もあるだろう。
とくにSH4とμITORNに対応しているということは、MP3対応のカーオーディオなどに搭載されることなどが想定される。今後面白い機材が生まれてきそうだ。また同社では、国内だけでなく米国を中心に海外メーカーにも積極的に働きかけていくとのことなので、日本のレコメンデーション技術が海外へ普及する可能性もある。
実際に使ってみて、まだ発展の余地はありそうだったが、国内の音楽レコメンデーション技術、ミュージックソムリエが今後どのように普及していくか楽しみである。
□松下電器産業のホームページ(2003年12月22日)
= 藤本健 = | ライター兼エディター。某大手出版社に勤務しつつ、MIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。最近の著書に「ザ・ベスト・リファレンスブック Cubase SX/SL」(リットーミュージック)、「MASTER OF REASON」(BNN新社)などがある。また、All About JapanのDTM・デジタルレコーディング担当ガイドも勤めている。 |
[Text by 藤本健]
00 | ||
00 | AV Watchホームページ | 00 |
00 |
|