2007年9月23日のブックマーク (2件)

  • 高次元Lp 空間における近似最近傍点探索の分散処理手法

    社団法人 電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS 信学技報 TECHNICAL REPORT OF IEICE. 高次元 Lp 空間における近似最近傍点探索の分散処理手法 岡 敏生† 森川 博之† 青山 友紀†† † 東京大学大学院新領域創成科学研究科 †† 東京大学大学院情報理工学系研究科 〒 113-8656 東京都文京区郷 7–3–1 東京大学工学部 3 号館 E-mail: †{oka,mori,aoyama}@mlab.t.u-tokyo.ac.jp あらまし 稿では類似検索に利用される高次元 Lp 空間における近似最近傍点探索について検討を行った.近似最 近傍点探索の計算量はデータセットの増大とともに大きくなってしまうため,大規模なデータを扱うためには

    ceekz
    ceekz 2007/09/23
    Locality-Sensitive Hashing
  • Locality-Sensitive Hashingを用いた階層的クラスタ解析手法の高速化

    Locality-Sensitive Hashing を用いた階層的クラスタ解析手法の高速化 石橋 徹夫,古賀 久志,渡辺 俊典,菅原 研 電気通信大学 大学院 情報システム学研究科 〒182-8585 東京都調布市調布ヶ丘 1-5-1 E-mail {ishib-te, koga, watanabe, sugawara}@sd.is.uec.ac.jp 概要 階層的クラスタ解析手法は類似度でデータを階層的に分類し、その結果は樹形図で表現するこ とができる。この手法を用いると細かい分類から大まかな分類までクラスタ間の包含関係が理解し やすいが、計算量は大きなものとなるので、高次元・大規模データに対して適用することは難しい。 そこで研究では最近接点の候補を高速に見つけるアルゴリズムである Locality-Sensitive Hashing によって作られるハッシュテーブルを用いて、計算