ついに本題に入ります. 今回やること 「集合知プログラミング」の3章で使われている,単語の頻度がファイルになっている"blogdata.txt"を使って,階層型クラスタを作成します. 得られる結果はp.47にあるデンドログラムと同じになるはずですが... blogdata.txtの読み込み blogdata.txtはTSV(Tab Separated Values)になっています. このファイルを読み込み,URLをキーにしたHashに格納します. def blog_data_from(file) word_counts = {} lines = File.open(file, 'r').readlines # 先頭行を読んで,単語の配列を作る words = lines.shift.chomp.split("\t") words.delete('Blog') lines.each do |