NECは4月14日、ブログや掲示板などの文章から、商品やブランドに関する評判を抽出する技術「文特性分布計算方式」を開発したと発表した。ユーザーの主観や感情を表す「意見文」や、特定の話題に関連した「トピック関連文」を的確に抽出できるという。 従来の方式では、1つの文に含まれている「良い」「悪い」「高い」「安い」などの単語と、その対象となる製品やサービスなどを特定することで評判を抽出していた。しかし、この方式では、製品やサービス名が省略されている短い文や、単語とその対象が離れて書かれている文では、評判を抽出できないことがあった。このため、文ごとを対象とするのではなく、複数の文章をまとめて扱える技術が必要だったという。 文特性分布計算方式では、話題は複数の文章にわたって書かれる傾向がある、という点に着目した。3つの文を1セットとした文の集合の中に、いくつの意見文やトピック関連文が含まれているかを
![NEC、商品などの評判をブログや掲示板から抽出する技術を開発](https://cdn-ak-scissors.b.st-hatena.com/image/square/b2e7e8148382fd7b3dec79b2c199e08ace74193a/height=288;version=1;width=512/https%3A%2F%2Fjapan.cnet.com%2Fmedia%2Fc%2F2012%2Fimages%2Flogo%2Flogo_ogp_1200.png)