ニュース

NHK技研、番組制作支援向け生成AIを開発。約40年分のニュース学習で回答精度向上

阿部邦弘

2025年5月26日 12:40

NHK放送技術研究所(技研)は、NHKが放送したニュースなどのデータを学習させた大規模言語モデル(LLM)を開発。報道された事実に関して、誤った回答をする割合を約1割減らす回答精度を実現したという。本技術は5月29日から6月1日まで開催される「技研公開2025」で展示される。

LLMは大量のテキストデータを学習することで、あるテキストを入力すると、それに続くテキストを予測して出力する、自然言語処理に特化した生成AIの一種。

翻訳、要約、文章校正、プログラム作成など、幅広い業務に応用が可能だが、LLMには事実と異なる回答をしてしまうといった課題があるため、特に番組制作など正確性が求められる業務では慎重な対応が求められている。

NHKでは、番組制作者がよりクリエイティブな業務に集中できる環境の構築を目指し、これまでに番組制作支援のための日英機械翻訳システムや番組要約システムなどの研究・開発を行なってきた。現在は、番組制作の準備段階での情報収集支援や翻訳、文章校正などの業務支援を想定し、LLMの研究開発を進めている。

技研では既存のLLMをベースに、過去にNHKが放送した約40年分のニュース原稿やニュース記事、番組字幕などの放送局データ(約2,000万文)を追加学習させたLLMを構築。これにより、過去に放送したニュースの内容をよく理解し、事実と異なる誤った回答をしにくくさせた。また、ニュースで頻繁に使用する用語や表現に対する理解力も向上したという。

外部機関が実施するニュース報道に関する検定試験を用いた評価実験では、LLMに放送局データを学習させることで、報道された事実に関して誤った回答をする割合が、学習前と比較して約1割減少した。

構築したLLMがニュースの時事的な知識を獲得していることを確認した一方、番組制作支援のツールとして活用するには更なる改良が必要とのこと。技研では誤った回答のより少ないLLMの実現を目指し、引き続き研究を進める。

今後は、LLMの回答精度向上に加え、テキストだけでなく映像や音声など多様な情報を扱うマルチモーダル化に取り組み、安全性と機能性を兼ね備えたLLMの開発を目指すという。