[ 連載 ] フリーソフトによるデータ解析・マイニング第 28 回 R とクラスター分析(1) 1 .クラスター分析とは 我 々は、物事を整理整頓する際には、機能、 形状などの側面から似ているものを同じのとこ ろに集めて、片付ける。これと同じくデータに ついてもデータ構造の側面から似ている個体を 同じのグループに仕分けることが必要である場 合がある。データサイエンスにおける分類のた めの方法は、学習(教師、訓練)データがある分 類方法と学習データがない方法に大別される。 ここで言う学習データとは、どの個体がどの グループに属するかが既知であるデータである。 グループの所属を示すデータは外的基準とも呼 ばれている。学習データがある場合の分類方法 は、どの個体がどのグループに属するかが既知 であるデータから、分類に関するモデルを作成 し、そのモデルに基づいて、グループの属性が 未知であるデ