はじめに 本エントリはデータが曖昧に分類されるのをグラフ描画して見てみたいという動機で、 適当なサンプルデータに対してファジークラスタリング手法の1つである fuzzy k-means 法を実施してみたという内容です。 fuzzy k-means は Hadoop 上で動く機械学習ライブラリ Apache Mahout により実行したので、そちらのコマンド等も記載します。 k-means もいいんだけど… fuzzy k-means は知らないけど k-means なら知っている、という方もいらっしゃると思います。 k-means 法は最もオーソドックスなクラスタリング手法でアルゴリズムも理解しやすく、様々な BI ツールで実装されています。 また、実データで上手くクラスタリングできることが多く、いろいろなところで使われているのではないでしょうか。 しかし、k-means にもいくつか問題
![Mahout で fuzzy k-means やってみた - ALBERT Engineering Blog](https://cdn-ak-scissors.b.st-hatena.com/image/square/5fb85838105707e132d7f223cae802564bc978a5/height=288;version=1;width=512/http%3A%2F%2Ftech.albert2005.co.jp%2Fimages%2Fpost_images%2Fconcept_k-means.png)