クラスタ分析って?K平均法って? こんなの。 クラスタ分析:データを似たもの同士グループ分けする分析。 K平均法:クラスタ分析の手法のひとつ。 応用分野は色々あるけど、まぁ一番わかりやすい例が 座標上にバラバラに散らばった点をご近所さん同士まとめるプログラム。 今回作るのがこれ。 どうやるの? Wikipediaによると、こうやるらしい。 K-平均法は、一般には以下のような流れで実装される。 データの数を n 、クラスタの数を K としておく。 1.各データ x_i(i=1... n) に対してランダムにクラスタを割り振る。 2.割り振ったデータをもとに各クラスタの中心 V_j(j=1... K) を計算する。計算は通常割り当てられたデータの各要素の算術平均が使用される。 3.各 x_i と各 V_j との距離を求め、x_i を最も近い中心のクラスタに割り当て直す。 4.上記の処理で全ての
![K平均法(K-means)でクラスタ分析してみる - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/b8629ca7502542fbbee681b387e24f975805b1b9/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9SyVFNSVCOSVCMyVFNSU5RCU4NyVFNiVCMyU5NSUyOEstbWVhbnMlMjklRTMlODElQTclRTMlODIlQUYlRTMlODMlQTklRTMlODIlQjklRTMlODIlQkYlRTUlODglODYlRTYlOUUlOTAlRTMlODElOTclRTMlODElQTYlRTMlODElQkYlRTMlODIlOEImdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT01NiZ0eHQtY2xpcD1lbGxpcHNpcyZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPTQ4ZTJkNzVkNDliOWEzYzA2ODY1NWYwYWI0MTFhMGZh%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwa3VyZWhhamltZSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9ZTY4NzAzNTVlNjE5MjhjNmEzMzM5Zjk0ZTQ4OGZlZWI%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3Ddda0bb2d3ff98ad337480ee45abd23c7)