固有表現抽出 Named Entity Recognition 目次 背景 演習の流れ 参考文献 背景 大量の言語データから情報抽出を行う際の中心的な技術として固有表現抽出が知られています[1][2](デモ例1[7], デモ例2[8]).固有表現とは,組織名(会社名,団体名など),人名,地名,製品名などであり,言語データ中のどの部分が固有表現に対応しているかを解析することが固有表現抽出のタスクとなります.これらの抽出された固有表現を利用して,文の意味解析などさらに高度なアプリケーションを作ることが可能となります. 例えば,”今日は本郷で山田教授と田中さんからThinkpadの使い方を教えてもらいました.”,の文から固有表現として人名,地名,製品名を取り出す場合は,”本郷”(地名),”山田”,”田中”(人名),”Thinkpad”(製品名)が固有表現として抽出されることになります.そして,