実践・自然言語処理シリーズ第4巻 情報抽出・固有表現抽出のための基礎知識 岩倉 友哉, 関根 聡 近代科学社 3,300円 (3,000円+税) 自然言語テキストを抽出・活用!本シリーズ第4巻に位置付けられる書。本書では、固有表現抽出技術と,固有表現間の関係を抽出する関係抽出技術に焦点を当て、機械学習などを駆使して「情報抽出器」を作るための解説を行う。 関連サイト本書の関連ページが用意されています。 情報抽出・固有表現抽出のための基礎知識(近代科学社ウェブサイト)内容紹介社会の中で日々蓄積されていく電子データの多くは自然言語で書かれたテキストであり、情報社会の伝達手段や知識源として使われている。 これらの情報をデータベースとして整理・構造化し、活用するには、拡散した情報を適切に抽出し関係づける必要がある。このプロセスを(半)自動化する技術が「情報抽出」である。その際、各分野固有の自然言語表
![実践・自然言語処理シリーズ第4巻 情報抽出・固有表現抽出のための基礎知識](https://cdn-ak-scissors.b.st-hatena.com/image/square/09a230c8469ab2d0eef6297723743f62af7a59c8/height=288;version=1;width=512/https%3A%2F%2Ftatsu-zine.com%2Fimages%2Fbooks%2F1203%2Fcover_l.jpg)