階層クラスタリングは、データマイニング手法の一つです。 今回はこの手法を、はてなブックマークのタグ付けデータに対して適用しました。 まずは、結果から紹介します: より大規模なデータセットを用いて解析した結果はこちら: ツリー表現 タグクラウド表現 === 解説 === 階層クラスタリングは、 「類似する要素をグループ化し、 徐々にそのグループもグループ化していき、 最終的に一つのグループにして、 階層的に要素およびグループを表現する」手法です。 上の例では、 “レシピ”と”料理”がまずグループ化されて、次に、そのグループと”食”がグループ化されています。 そのグループはさらに、音楽やアニメ、ゲーム関連の要素 (”音楽”、”music”、”アニメ”、”ニコニコ動画”、”著作権、”game”、”ゲーム”) からなる階層的なグループと統合されています。 このようなグル