2009年11月17日のブックマーク (2件)

  • リンク解析とか: 重要度尺度と von Neumann カーネル - smly’s notepad

    NAIST の入学手続を終えた. 残りの期間はサーベイするぞーということで shimbo 先生の講義資料「リンク解析とその周辺の話題」を読んでいます. 一日目, 二日目の資料は PageRank, HITS, SALSA などの重要度尺度の紹介と, von Neumann Kernels と HITS の関係についてのお話が中心. これらを実装してみた. 後半に進むほど力尽きて記述が適当になってます:)PageRankポイントはランダム遷移行列による random walk では定常分布に収束しない (エルゴード性 (ergodic) を満たさない) という点. どうして満たさないかというと. sink (出次数のない節点) が存在するとき, 明らかに既約 (irreducible) でないのでエルゴード性を満たさない. 複数の強連結成分を持つケース => 周期性を持つと考えてよい? 周期

    psyq
    psyq 2009/11/17
    重要度尺度を決定するアルゴリズムのうち、PageRankとHITSとvon Neumann KernelをPythonで実装して解説。
  • Google PageRank Algorithm - Tocotonistの日記(晴れのち快晴)

    今のGoogle SearchのScoringにどのくらいの大きさで影響を持っているかは不明ではあるが,Googleを有名にしたアルゴリズムであることには間違いないですね. 収束性まで理解するのは少し数遊びに強くないといけませんが,scaleを気にしないcodingは容易です.単に繰り返しAdjancy Matrix(隣接行列)を収束するまで累乗していくだけです. PDL で PageRank by 伊藤直也さん, 20090305 しかし,Scaleのためには幾つか大事な点があります. Adjancy Matrixの要素が,疎であること(ゼロが多いこと)を利用してデータとしてフルマトリックスで持たないこと 行列計算を公平にしないこと 各行や各列ごとに要素の更新頻度の違いを見て,行列計算の更新頻度を行や列ごとに変えます Googleさんお得意の分散処理 PageRankの簡単に勉強するなら

    Google PageRank Algorithm - Tocotonistの日記(晴れのち快晴)