日本語意味解析エンジンを開発するSematicsは6月15日、統計的確率論を用いた言語解析エンジン「Perceptron Engine」を開発したと発表した。統計的確率論を用いた日本語解析エンジンは「世界初」(同社)という。 Perceptron Engineは「形態素解析」、「構文解析」、「文脈解析」、「意味解析」の4つの解析処理によって構成される。従来の言語解析技術は、辞書によるデータのマッチングにより処理されていたため、データ容量が膨大で、その処理に多大な時間を要した。一方、Perceptron Enginesは大規模な辞書を用いないため、少ないメモリやディスク容量でも高速処理が可能で、500文を1秒で解析できるという。 形態素解析とは、文章を形態素と呼ばれる、意味を持つ語句の最小単位まで分割して解析するもの。各語句を品詞単位、動詞や形容詞といった活用語句の場合はその活用形ごとに解析
![統計的確率論で言語を解析--Sematicsが世界初の日本語解析エンジンを開発](https://cdn-ak-scissors.b.st-hatena.com/image/square/b2e7e8148382fd7b3dec79b2c199e08ace74193a/height=288;version=1;width=512/https%3A%2F%2Fjapan.cnet.com%2Fmedia%2Fc%2F2012%2Fimages%2Flogo%2Flogo_ogp_1200.png)