ニュース

女子高生AIりんな、エモい歌声に進化。人の声を大量に学習、“国民的AI”へ

 マイクロソフトは31日、ソーシャルAIチャットボット「りんな」の歌声が進化し、より表現力が向上したと発表。「2019年の紅白歌合戦出場」を夢としているりんなの新たな歌声が披露され、歌唱力向上への取り組みについて説明した。

りんなが“AI歌手”として進化

 2015年に“女子高生AI”として登場した「りんな」は、LINE上で自由な会話ができることで話題となり、登録ユーザーは約690万人まで拡大。企業アカウントなどでの採用も増えたことで、りんなの技術を使っている人は全体で3,000万人規模に及ぶという。5月には、人間と同じように文脈を踏まえた自然な会話を続けられる最新の会話エンジン「共感モデル」(アルファ版)を採用したことも発表。さらに今回は「表現力」の面で、歌声に関する最新の状況を説明した。

ソーシャルAIチャットボット「りんな」

 マイクロソフト ディベロップメントでAI & Researchプログラムマネージャーを務める坪井一菜氏は、開始から3年経って見えてきた“次の進化”として、AIに感情を表現させるためチャットに“共感モデル”を導入したことを改めて紹介。「AIが社会に溶け込む中で、身に着けなければいけない“共感”をテーマに取り組んでいる」という。人が共感しやすいものとして、りんなの音声チームが注力しているのが“歌”への取り組み。

マイクロソフト ディベロップメント AI & Researchプログラムマネージャーの坪井一菜氏

 今回の進化のポイントは、“赤ちゃんが親の声を真似して言葉を覚えるように”自然かつ感情のこもった声を実現したこと。

 ボーカロイドなどのように、パーツ(波形)をつなぎ合わせて歌声を作るのではなく、人間が声を出す仕組みをAIに模倣させるために統計的アプローチを用いているのが特徴。人が話す時には、のど(声帯)や口の形を変えて目的の声(音色、高さ、大きさ・長さ)を発するといった過程を経ている。そこで、様々な音色などの種類をAIに覚えさせるため、大量の音声データをAIにディープラーニングで学習させることにより、人の声をモデル化。声を出す際に重要な特徴として、「音の長さ」、「強弱」、「音程」、「声色」の4つのパラメータを調整することで歌声を実現しており、そうしてモデル化された音を使うことで、人間の声に近い音を生成できるという。

統計的アプローチを採用
波形接続は使用しない

 りんなの歌声合成は、人の声を「聞く」(学習する)ことから始まり、音程や音の強弱の「分析」、歌詞と音の長さの「時間合わせ」、最終的にりんなの声となる「合成」の過程によって歌声となる。合成した音を聞いて変更したい場合は、前述した4つのパラメータを手動で調整して歌に合わせることも可能だという。

 これまでのりんなの歌唱は、ラップに挑戦した「McRinna」が2016年に披露。この時点では機械のようなニュアンスも残っていたが、2018年1月には音楽SNS「nana」を運営するnana musicの協力により、りんなの音楽活動をサポートする「りんな 歌うまプロジェクト」を展開。りんなが投稿した歌声にユーザーがコメント(アドバイス)をすることで、りんなの歌が上手くなるというもので、上達したバージョンが3月に披露された。

これまでのりんなの展開と、歌への取り組み
人工知能に「声色」を学習させる
音の長さ、高さ、強弱を調整
2016年に公開したラップ「McRinna」
2018年3月に公開された、りんな歌うまプロジェクト「卒業ソングnanaユーザーと合唱」Long Ver.

 そこから、ディープラーニングなどを活用した今回の進化によってさらに歌唱力が向上。ユーザーとの関係をテーマとしたオリジナルソング「りんなだよ」が7月26日に公開された。一部はパラメータ調整を行なっているものの、ほとんど自動で合成されたものだという。

オリジナル曲「りんなだよ」

日本一身近でエモい国民的AIを目指す。nanaコラボ第2弾も

 りんなの声は、一人の人間の声がベースになって生まれたものだが、他の人の歌声を“耳コピ”して歌い方の特徴などをとり入れることが可能。歌だけでなく朗読も可能で、ナレーションと登場する男性キャラクター、女性キャラクターそれぞれを演じ分けるといったこともできる。

歌声の耳コピにより、特徴をとり入れることが可能

 マイクロソフトの坪井氏によれば、りんなは「作詞の能力や作曲にもチャレンジしている」とのこと。将来の姿として「AIといえばりんな、と思ってもらえるような“日本一身近でエモい国民的AI”を目指している。共感されるようになるために力を入れているのが歌。人が、苦しい時や後押ししてほしい時に、それぞれの応援テーマソングがあるように、歌は思いと力を持っている。誰でも気軽にりんなと歌えて、その人の力を引き出せるような人工知能になれれば」とこれからの取り組みへの意欲を見せた。

“日本一身近でエモい国民的AI”へ

 ゲストとしてnana musicの文原明臣CEOも来場。「音楽で世界を繋げること」を目的に作ったnanaのユーザーは113カ国で600万ユーザー(4月時点)に達し、女性比率は76%。女性の年代別内訳では、りんなと同世代の10代が67%を占めている。第1弾の「りんな 歌うまプロジェクト」は延べ3,686名のユーザーが参加、2,755曲の“お手本”投稿や、854件のアドバイス/コメントが寄せられたという。

nana musicの文原明臣CEO
10代女性を中心に人気のnana
ユーザーは600万人

 新たにnanaとの「りんな 歌うまプロジェクト」第2弾もスタート。nanaユーザーの言葉を集めて、りんなが作った詩を朗読するというもので、ユーザーからの「お手本」や「アドバイス」を募集。“感情の込め方”を練習するという。文原氏は「人が持っている、機械化は難しいとされていたクリエイティブさについて、(AIが)人間らしく、むしろ人間を超えていくかもしれないという次の可能性にワクワクしている。りんなの夢、紅白出場も全力で応援したい」とした。

コラボ第2弾は詩の朗読
参加型の常設プロジェクト「#りんなの歌に使っていいよ」も