タグ

MinHashに関するang65のブックマーク (4)

  • MinHashクラスタリング - CatTail Wiki*

    MinHash法を使ったクラスタリング ユーザ毎のクリックページや購入商品など,ユーザに紐付けられたデータに対して,お互いのアイテムの共通性から,ユーザをクラスタリングする手法のひとつ. K-means法など伝統的なクラスタリングとは異なり,非常に小さい多数のクラスタに分かれやすい. 実行するごとに,乱数を発生させており,かなり異なるクラスタが作られるので,1ユーザに何通りものクラスタを与えることができる. ***************************************************************** MinHash.sas MinHash法によるクラスタリング 20080706 翔 *****************************************************************; options nocenter co

    MinHashクラスタリング - CatTail Wiki*
  • Microsoft PowerPoint - minhash.ppt

  • MinHashによる高速な類似検索 - Preferred Networks Research & Development

    年が明けてもう一ヶ月経ちましたね.岡野原です. 今日はMinHashと呼ばれる手法を紹介します.これは特徴ベクトルの高速な類似検索に利用することができます(クローラーの文脈だとShingleとして知られている). 今や世の中のあらゆる種類のデータが,高次元のバイナリベクトルからなる特徴ベクトルで表されて処理されるようになってきました.例えば文書データであれば文書中に出現する単語やキーワードの出現情報を並べた単語空間ベクトル(Bag of Words)で表し,画像データも,SIFTをはじめとした局所特徴量を並べた特徴ベクトル(とそれをSkecth化したもの)として表せます.行動情報や時系列データも特徴量をうまく抽出する.グラフデータもFast subtree kernels[1]と呼ばれる方法で非常に効率的に特徴ベクトルに変換することができ,グラフの特徴をよく捉えることができるのが最近わかっ

    MinHashによる高速な類似検索 - Preferred Networks Research & Development
  • 20110214nips2010 read

    The document summarizes two papers presented at NIPS 2010: 1) "b-Bit Minwise Hashing for Estimating Three-Way Similarities" which introduces a method called b-bit minwise hashing to estimate Jaccard similarity between three sets using only b bits per element. 2) "Functional Geometry Alignment and Localization of Brain Areas" which presents a method called functional geometry alignment to register

    20110214nips2010 read
  • 1