Photo by Rene Barrios 秋山です。 機械学習と一言で言っても、そのアルゴリズムにはたくさんの種類があり、「どれがどんな場合に適しているのか」というのは、なかなかわかりづらいと思います。 そこで今回は、初心者向けに「K-means」(k平均法)という手法について説明します。 K-meansがどんなデータに適しているか、どうやってデータが分離されるのか…といったことは、文章だけ読んでも分かりづらいと思いますので、実際にPythonでコードを書いて実行したり、図を出したりして、過程を見ながら説明していきます。 既に機械学習の経験がある人にとっては今さらなことばかりかと思いますが、「機械学習の勉強を始めたい」という人の参考になればと思います。 ■K-meansとは 簡単に説明しますと、 まず、各点に対してランダムにどのクラスタに属するかを決定します。 次に、各クラスタの中心点V