Information Extraction 文書から関連する情報を抜き出す方法。 人 組織 場所 イベント IEを難しくさせているのは抜き出す対象のデータがテキストであり、構造化されていないこと。 もちろん構造化されていないこと自体は他のNLPのタスクでも共通することだが、一定のパターンがあれば正規表現のパターンで情報を抜き出したりできるが、基本的に処理対象となるテキストデータはフリーフォーマットで決まった形式を持たずに記述されていることがほとんどで、そうした手法が使えない。 IEを使ったアプリケーション ニュース等のタグ付け チャットボット 適切な回答を返すためにはユーザからの質問にどのような情報が含まれているか理解する必要がある ソーシャルメディアを利用したアプリケーション 具体的な例としてTwitterから渋滞の情報に関するツイートを抜き出して表示するアプリケーションなど フォーム