情報検索 (IR) のみならず、いろいろな分野で応用されているPageRankアルゴリズムについてまとめます。 PageRank PageRankはリンク分析 (link analysis) に分類されるアルゴリズムで、1998年に提案されました (提案論文PDF) 。以下の特徴を持ってます。 リンク構造が明確なコンテンツに向いている 最初はWebの検索エンジンに適用された クローリングで取得したhtmlファイルのリンクタグを抽出するだけで良いため 現在はソーシャルネットワークや自然言語処理などでも応用されてます Python: LexRankで日本語の記事を要約する - け日記で紹介した要約アルゴリズムもPageRankから着想を得てます コンテンツの解析だけでランキング化ができる 検索結果に対してこのページはクリックされた/されなかった、などのフィードバックが不要 アルゴリズムを大雑把
![いまさら学ぶPageRankアルゴリズム - け日記](https://cdn-ak-scissors.b.st-hatena.com/image/square/bd19f1f495057a5d972b93292e45f85a460c79a2/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fo%2Fohke%2F20181229%2F20181229115605.png)