タグ

SQLとkmeansに関するxiangzeのブックマーク (1)

  • PL/CUDAでk-means法を実装する - KaiGaiの俺メモ

    前回のエントリでは、CBI学会で発表を行った、PL/CUDAによる類似化合物の検索について説明した。 今回は、コレとはまた別のワークロードに対する応用という事で、クラスタリング処理のIn-Database実装に挑戦してみた。 トライしてみたのは k-means法 によるクラスタリング。非階層クラスタリングの領域では最も頻繁に使用される(と、言われている)アルゴリズムで、計算量もそこそこ大きい。 k-meansクラスタリングとは 教師なし学習方式の一つで、所与のデータ群を一定数(=k個)のグループに分類するためのアルゴリズムである。 以下のステップを一定回数、またはクラスタに属するデータ群に変化がなくなるまで繰り返す。 1.初期クラスタをランダムに設定する。 2.各クラスタの中心点を計算する。 3.各データ要素の属するクラスタを更新する。各データ要素はクラスタ中心点が最も近傍であるクラスタに

    PL/CUDAでk-means法を実装する - KaiGaiの俺メモ
  • 1