後藤 淳 自然言語処理は,人が書いたり話したりする言語を,コンピューターが取り扱うための技術であり,計算機科学の分野の一つである。放送局では,コンテンツの制作過程でさまざまな形でテキストデータを取り扱っている。それらのデータの規模も拡大しており,コンテンツ制作を支援する自然言語処理技術が注目されている。本稿では,自然言語処理技術の研究の中でも,特に情報抽出および情報分類技術を中心に解説する。具体的には,放送コンテンツへのメタ情報付与,ソーシャルメディアからの情報収集,学術情報からの知見獲得などの自然言語処理の研究動向を解説し,当所における取り組みを紹介する。 1.はじめに 放送局では,番組制作の過程で,さまざまな形でテキストデータを取り扱っており,自然言語処理を用いた制作支援が期待できる。放送局で取り扱うテキストデータとしては,例えば,テレビやラジオで放送されるニュースの原稿,ナレーション