大規模テキストデータに対する高速クラスタリングの手法 ----Lucene と Hadoop の並列分散処理の利用研究 High-speed clustering technique for large scale data ---- The research of Lucene and Hadoop distributed technology 胡 亜莉 1 山下雅喜 2 工藤修一 3 木村雅史 3 Yali Hu1 , Masayoshi Yamashita2 , Shuichi Kudou3 , Masafumi Kimura3 1,2,3 SCSK 株式会社 1,2,3 SCSK Corporation Abstract: With the popularization of internet it is much easier to obtain large amount in