情報検索 (IR) のみならず、いろいろな分野で応用されているPageRankアルゴリズムについてまとめます。 PageRank PageRankはリンク分析 (link analysis) に分類されるアルゴリズムで、1998年に提案されました (提案論文PDF) 。以下の特徴を持ってます。 リンク構造が明確なコンテンツに向いている 最初はWebの検索エンジンに適用された クローリングで取得したhtmlファイルのリンクタグを抽出するだけで良いため 現在はソーシャルネットワークや自然言語処理などでも応用されてます Python: LexRankで日本語の記事を要約する - け日記で紹介した要約アルゴリズムもPageRankから着想を得てます コンテンツの解析だけでランキング化ができる 検索結果に対してこのページはクリックされた/されなかった、などのフィードバックが不要 アルゴリズムを大雑把