タグ

LSHとPageRankに関するyassのブックマーク (2)

  • 大規模データのマイニング - 共立出版

    ウェブやインターネットコマースの隆盛によって、とてつもなく巨大なデータセットが出現し、そして、データマイニングによってそれらから情報が抽出されている。 巨大なデータに対するマイニングにおいては、従来から知られているアルゴリズムがそのままでは機能しないことが多い。巨大なデータを扱う上でこれまでとは違った処理戦略や技法が必要となる。 書はデータマイニングにおいて重要な問題の解決に使われてきており、さらに巨大なデータセットに対しても使用できる実用的なアルゴリズムを、データベースやウェブ技術の分野で著名な原著者が解説する。 まず、データマイニングの質や、データマイニングがどのように扱われているかを概観する。次に、今後非常に大量のデータの解析を行う際に、クラウドコンピューティングとともに重要視されると考えられ、この後の章の議論に必須のものとなるマップレデュースを解説する。その後、類似するアイテム

    大規模データのマイニング - 共立出版
  • Stanford CS345A: Data Mining

    Handouts: 1/5: Introduction Introduction [slides] [reading] 1/7: MapReduce MapReduce [slides] [reading] 1/12: Recommendation System Recommendation System [slides] [reading] 1/14: Near Neighbor Search in High Dimensional Data Near Neighbor Search in High Dimensional Data [slides] [reading] 1/19: Locality Sensitive Hashing (LSH) Locality Sensitive Hashing (LSH) [slides] [reading] 1/21: Structure of

  • 1