タグ

ブックマーク / blog.pasonatech.co.jp (1)

  • 計れないものを計る! | | プログラマ2.0日報 | あすなろBLOG

    「XOR」行の合計 3 が、Aさんの見た映画とBさんの見た映画の「差」であるハミング距離になるわけです(Tanimoto係数だと一致すればするほど値が大きくなりますが、ハミング距離だと一致すれば最小の0になります)。 その他にも、いろいろな「(集合の違いなど)定性的とも考えられる「状態」を、違いを表す数値にする」さまざまな尺度があります。まあ、ですから、ここらへん「どれを使うのか」というのは 場合によりけり... というものです。こういう尺度を使うと、 差の値が2倍だから、中身の違いも「2倍違う」 なんて思うと大間違いなのが一般です。単に大小関係しか信用できないケースがほとんどです。ここらへん大きく見るといわゆる「ノンパラメトリック検定」と呼ばれる統計手法で、 母集団の分布に関する一切の仮定がない検定手法 の手法の一つなんですね。勿論いわゆる「連続な値を計れる数値」でやる検定で、しかも測定

  • 1