二年ほど前,k-means をさらに速くする - ny23の日記 で書いた三角不等式を利用した高速 k-means の C++ 実装を公開した.以下の三つの論文を組み合わせた実装になっている.二年前の実装と比べると別解が出力できるようになったのが大きな違い. G. Hamerly. Making k-means even faster. (SDM 2010) D. Arthur and S. Vassilvitskii. k-means++: the advantages of careful seeding. (SODA 2007) [New] Y. Cui et al. Non-redundant multi-view clustering via orthogonalization. (ICDM, 2007) 前者二つを実装したのが二年前,別解出力をサポートしたのも一年以上前になる.