MinHash法を使ったクラスタリング ユーザ毎のクリックページや購入商品など,ユーザに紐付けられたデータに対して,お互いのアイテムの共通性から,ユーザをクラスタリングする手法のひとつ. K-means法など伝統的なクラスタリングとは異なり,非常に小さい多数のクラスタに分かれやすい. 実行するごとに,乱数を発生させており,かなり異なるクラスタが作られるので,1ユーザに何通りものクラスタを与えることができる. ***************************************************************** MinHash.sas MinHash法によるクラスタリング 20080706 翔 *****************************************************************; options nocenter co