社内NEET宣言文学部出身なのにIT企業で研究開発をすることになった社員のブログです。エンジニア/ニートSimilarity Joinレポート・実験 [参考]Similarity Joinの話 最近Similarity Join関連のアルゴリズムを調査しています。 http://www.cse.unsw.edu.au/~weiw/project/tutorial-simjoin-SEBD08.pdf http://www.cse.unsw.edu.au/~weiw/project/PPJoin-WWW08.ppt 類似しているデータの探索関連のアルゴリズムについて、 最近論文が多く発表され、活況を呈しているようです。 背景にはWebを中心とした大規模データのデータ解析、マイニング、類似検索、クラスタリングへの需要が増えている、ということが挙げられるでしょうね。 Similar