タグ

ブックマーク / fujimizu.hatenablog.com (1)

  • WikipediaのキーワードリンクでHITSアルゴリズムを試す - のんびり読書日記

    昨日の記事で作成した、Wikipediaのキーワードリンクのデータを使って、HITSアルゴリズムを試してみます。 HITSはグラフ理論では有名なアルゴリズムで、リンク関係を使用してネットワーク中の重要なノードを特定する手法です。HITSで求められるノードには、AuthorityとHubの2種類があります。Authorityはその名の通りネットワーク中で権威のあるノードで、情報量が豊富であるなどといった特徴を持ちます。Hubは権威のあるノードに多くつながっているノードで、Webではリンク集ページなどに相当します。 考え方はPageRankと似ており、Yahooの検索でもHITSが使用されているらしいです。HITS具体的なアルゴリズムについては、解説しているページが多く存在するので、そちらを参照してください。 では実際にWikipediaのデータを使って、AuthorityとHubを求めてみま

    WikipediaのキーワードリンクでHITSアルゴリズムを試す - のんびり読書日記
  • 1