タグ

2012年3月29日のブックマーク (1件)

  • Mahout: Data Converter for Clustering - hamadakoichi blog

    Mahout Clustering 実行の入力形式へ変換する DataConverter を実装してみた。以下に Source Code、Command line 実行方法も含め紹介します。 Mahout は Hadoop上で動作する大規模 Data Mining/Machine Learning の Library。Mahout Clustering Packageには、K-Means, Fuzzy K-Means, Canopy, Mean Shift, Latent Dirichlet Allocation 等、豊富な実装が提供されている。ただ Random Forest, FPGrowth 等の他のアルゴリズムと異なり、Mahout Clustering 実装は、専用のデータ入力形式を必要とする。発展途上による情報の少なさ、および、入力データ生成の手続きを各自が実装する必要があるこ

    Mahout: Data Converter for Clustering - hamadakoichi blog