タグ

clusteringに関するy_yanbeのブックマーク (2)

  • Preferred Infrastructureの夏期インターンに行ってきました - kisa12012の日記

    8月の上旬から9月の下旬までの2ヶ月間、Preferred Infrastructure(PFI)の夏期インターンに参加してきました。 今回のインターンを振り返りつつ、ブログ記事を書きたいと思います。 PFIでのインターン PFIのインターンでは、インターン生1人1人が各自に定めたテーマに沿って開発を行うというスタイルをとっており、この点で講義や課題形式で行われるインターンとは大きく異なるところだと思います。 2ヶ月間のインターン中に、一定の成果を出すことが目標となります。 各自が取り組むテーマは、インターン生のバックグランドやPFIの事業分野を前提とした上で、インターン生の希望に合わせて定められます。 例として、PFIで現在提供しているソフトウェアを改良するために、今取り組むべき問題を解決する、またはPFIで過去に開発したライブラリを利用して、新しいソフトウェアやサービスを創り上げる事を

    Preferred Infrastructureの夏期インターンに行ってきました - kisa12012の日記
  • K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ

    K-means法は、入力データからK個のランダムな個体を初期クラスタの中心として選択し、以降、クラスタの重心を移動させるステップを繰り返すことでクラスタリングを行う非階層的手法です。K-means法はシンプルで高速ですが、初期値依存が大きいのが弱点で、不適切な初期値選択をすると間違った解に収束してしまいます。 以下は、Introduction to Information Retrievalの16章に出てくる例です。 {d1, d2, ..., d6}をK=2でクラスタリングする場合、{{d1, d2, d4, d5}, {d3, d6}}が大域最適解ですが、初期クラスタの中心をd2, d5で与えると、{{d1, d2, d3}, {d4, d5, d6}}という誤った解に収束してしまいます。 この問題を改善するK-means++という手法を見つけたので、試してみました。 K-means+

    K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ
  • 1