タグ

ブックマーク / qiita.com/ysks3n (2)

  • IIR 20章: ウェブのクローリングとインデックス付け - Qiita

    20.1 ウェブクローリング ウェブの世界からページを集め,それらをインデックス付し検索エンジンの手助けをするプロセス できるだけ有用なページを集める それらを結んで切るリンク情報を共に収集する 高速に,効率的に集める 20.1.1 クローラが提供すべき機能 頑健性 (robustness) スパイダートラップ => クローラをだましてある特定のドメインから無数のページを取り出させるように仕向けるウェブページ クローラはこのようなわなに対して体制を持たなければならない 礼儀正しさ (politeness) Webサーバはクローラがウェブサイトを訪問する比率を制御する暗示的,明示的なポリシーをもっており,これらは尊重されなければならない 20.1.2 クローラが提供すべき機能 分散性 クローラは複数の機会をまたがって分散された形で実行できるべきである スケーラビリティ クローラはマシンや帯域

    IIR 20章: ウェブのクローリングとインデックス付け - Qiita
  • Recommender Systems survey - Knowledge-Based Systems (2013) 読んだ (1/2) - Qiita

    Recommender Systems survey - Knowledge-Based Systems (2013) 読んだ (1/2)機械学習MachineLearning論文推薦システム 長いので2回に分ける 概要と読む動機 2012年10月投稿,2013年4月採択の推薦システムのサーベイ論文 最新の技術動向の流れを確認したくて読むことにした 著者らもこのサーベイは過去のものと違い,有名な手法ではなく推薦システムのの進化に焦点を当てると述べているので期待がもてる 推薦システムのサーベイ論文について イントロに書かれている内容の気になったところをメモ 近年の推薦システムの適用領域について http://dl.acm.org/citation.cfm?id=2181690 初期の推薦システムの方式について http://link.springer.com/article/10.1023/

    Recommender Systems survey - Knowledge-Based Systems (2013) 読んだ (1/2) - Qiita
  • 1