■説明 ・それぞれの文字列をmasiで類似度を計測する これは前回の記事参照 ・clusterモジュールのHierarchicalClusteringを使用して階層的クラスタリングで分類する easy_install cluster でインストールできる このアルゴリズムの説明は以下参照 http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/hierarchical.html HierarchicalClusteringのインスタンスを作るとき、第三引数で"single","complete","average"の3種類が選択できる。デフォルトはsingle. クラスターとクラスターを比較するさいに、最も近い距離動詞のアイテムで比較するか、平均するか、遠くのものを選択するかを選べる。 階層型クラスタリングは全てのノードがそ
