Matthewのブックマーク / 2009年1月14日

K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ

100 users
kaiseh.hatenadiary.org
暮らし

K-means法は、入力データからK個のランダムな個体を初期クラスタの中心として選択し、以降、クラスタの重心を移動させるステップを繰り返すことでクラスタリングを行う非階層的手法です。K-means法はシンプルで高速ですが、初期値依存が大きいのが弱点で、不適切な初期値選択をすると間違った解に収束してしまいます。以下は、Introduction to Information Retrievalの16章に出てくる例です。 {d1, d2, ..., d6}をK=2でクラスタリングする場合、{{d1, d2, d4, d5}, {d3, d6}}が大域最適解ですが、初期クラスタの中心をd2, d5で与えると、{{d1, d2, d3}, {d4, d5, d6}}という誤った解に収束してしまいます。この問題を改善するK-means++という手法を見つけたので、試してみました。 K-means+

K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ

はてなブックマーク

タグ

2009年1月14日のブックマーク (1件)

K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ

お知らせ

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

今週のはてなブックマーク数ランキング（2024年6月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス