リンク構造を用いてスコアを計算する HITS アルゴリズム 2011-11-10-1 [Algorithm][Programming] HITS とはハイパーリンク構造(リンクや被リンクなど)を用いてウェブページのスコアを計算する方法。Google で用いられている PageRank の仲間。 HITS は Authority score(以下、auth) と Hub score(以下、hub) の2種類のスコアを算出する。 アルゴリズム概要 各ページiの持つ auth を 、hub を とする。 をウェブグラフ全てのリンクの集合とし、 はページiからjへのリンクを表す(有無:1 or 0)とする。そして、以下の式(オリジナル論文での式)を繰り返し計算し最終的な auth と hub を得る。初期値は何らかの方法で与えられるとする。 実例で解説。下図のようなウェブグラフがあるとする。 初期
![リンク構造を用いてスコアを計算する HITS アルゴリズム](https://cdn-ak-scissors.b.st-hatena.com/image/square/cf18d36555768d30a03928cae3890ee860e53dd1/height=288;version=1;width=512/https%3A%2F%2Fasin.ta2o.net%2Fimg%2F4320122399-l.jpg)