原文(投稿日:2011/12/28)へのリンク 企業がソーシャルメディアを使って製品や企業自体の評判を調べる傾向が顕著になっている。これに伴い、単語と定量的メトリクスを使い、文書に含まれる感情を分析するという独特の課題が現れている。 Subramanian Kartik氏とEMCのGreenplumチームはブログ記事をMapReduceとPythonのNatural Language Toolkitを使い、EMC GreenplumデータベースのSQL分析と組み合わせてスパースベクトルとK-平均法アルゴリズムを用いて分析するという研究プロジェクトを行った。 Subramanianは昨年のNoSQL Now 2011カンファレンスでこの研究について発表した。InfoQはこのプロジェクトと背後にあるアーキテクチャについてSubramanianに詳しい話を聞いた。 InfoQ:Greenplum