これは 人工知能アドベントカレンダー の12日目の記事です。 前回は機械学習の大まかな解説をしました。今回はそのうちの教師なし学習(unsupervised learning)について詳しく見ていきましょう。 教師なし学習とはなにか 教師なし学習は、学習対象のデータはあるが、それが何かという正解(文脈によってはラベル、教師信号ともいう)は与えられていないので、どうにかしてなにかしらの構造や法則を見出すための手法です。 大抵の場合、クラスタリング系のアルゴリズムを扱うことが多いので、ここでもクラスタリングを中心にします。 クラスタリングとはなにか クラスタリング(clustering)は機械学習に限らずによく使われる言葉なので親しみやすいかと思います。 簡単に言えば、与えられたデータに対して、似たような物をまとめる処理です*1。 たとえば、以下の図を見てください。いくつかの図形が書いてありま