タグ

2021年3月9日のブックマーク (2件)

  • いまさら学ぶPageRankアルゴリズム - け日記

    情報検索 (IR) のみならず、いろいろな分野で応用されているPageRankアルゴリズムについてまとめます。 PageRank PageRankはリンク分析 (link analysis) に分類されるアルゴリズムで、1998年に提案されました (提案論文PDF) 。以下の特徴を持ってます。 リンク構造が明確なコンテンツに向いている 最初はWebの検索エンジンに適用された クローリングで取得したhtmlファイルのリンクタグを抽出するだけで良いため 現在はソーシャルネットワークや自然言語処理などでも応用されてます Python: LexRankで日語の記事を要約する - け日記で紹介した要約アルゴリズムもPageRankから着想を得てます コンテンツの解析だけでランキング化ができる 検索結果に対してこのページはクリックされた/されなかった、などのフィードバックが不要 アルゴリズムを大雑把

    いまさら学ぶPageRankアルゴリズム - け日記
  • The Anatomy of a Search Engine

    Computer Science Department, Stanford University, Stanford, CA 94305 In this paper, we present Google, a prototype of a large-scale search engine which makes heavy use of the structure present in hypertext. Google is designed to crawl and index the Web efficiently and produce much more satisfying search results than existing systems. The prototype with a full text and hyperlink database of at leas

    tomoemon
    tomoemon 2021/03/09
    pagerank