カイ二乗値で単語間の関連の強さを調べる 2007-09-19-1 [Algorithm][Programming] カイ2乗値を使って単語間の関連度を調べる方法。 つまり、関連語を探すときに、χ二乗値を関連度として使う。 perl によるサンプルコード (chiword.pl)。昔、勉強がてら作ったコード。 #!/usr/bin/perl use strict; use warnings; my %cnt; my $pair_num; while (<>) { chomp; next if /^\s*$/; my @list = sort split(/,/, $_); for (my $i = 0; $i < @list; $i++) { for (my $j = $i + 1; $j < @list; $j++) { next if $list[$i] eq $list[$j]; $c
![カイ二乗値で単語間の関連の強さを調べる](https://cdn-ak-scissors.b.st-hatena.com/image/square/da8adfb72d18ee6148e6e6ae0a25272ae6cbe00d/height=288;version=1;width=512/https%3A%2F%2Fasin.ta2o.net%2Fimg%2F0262133601-l.jpg)