昨日の記事からのつづき. 今日は本題の順位相関係数について書く. 元々は2つのリストの類似度を測る指標としての文脈で考えていたわけだけれど,実は2つの変数が正規分布しなかったり,離散値を取る時などに相関係数を測るノンパラメトリックな方法でもあることがわかった (昨日の話). 2つの順位相関係数について解説した後,ちょっと気になること,異なる集合の順序リストの相関係数を測る方法などについて書く. 順位相関係数 情報検索や推薦などにおいて,2つの順序リストが与えられた場合に,それらがどれほど 似ているかという類似性評価のために順位相関係数を用いる. ただ,前回説明したピアソン相関係数は確率変数が正規分布している仮定を置いているので,確率変数が明らかに正規分布していない場合の計算に利用できる. 順位相関係数はケンドールの順位相関係数と,スピアマンの順位相関係数というものがある.注意するべき点は,
![相関係数と順位相関係数について (2): 順位相関係数 - シリコンの谷のゾンビ](https://cdn-ak-scissors.b.st-hatena.com/image/square/9afce9d6819fbf4350308369825ea7d9e1fb1011/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fs%2Fsleepy_yoshi%2F20110327%2F20110327001243.png)