タグ

ブックマーク / mahito.info (1)

  • Mahito Sugiyama

    RでK-means++を実装する R に付属の関数 kmeans を使って,K-means++をなるべく高速に実装します.特に必要となるライブラリはありません. コード 検証 単純な例で速度を比較してみます.まずデータを生成します. > x <- rbind(matrix(rnorm(1e6, 0, 1), ncol=2), matrix(rnorm(1e6, 5, 1), ncol=2)) データ数1,000,000,次元数2,クラスタ数2のデータセットです. 速度は10回の平均で測ります,結果を入れるベクトルを用意しておきます. > t <- numeric(10) まずはベースライン.普通のK-meansです. > for (i in 1:10) t[i] <- system.time(kmeans(x, 2))[1]; mean(t) [1] 0.5734 # 単位は秒 次に,上に

  • 1