[B! Mahout] haltytのブックマーク

haltyt id:haltyt

Mahoutに関するhaltytのブックマーク (1)

第5回　K-MeansとCanopyクラスタリングでセグメンテーション分析を行う | gihyo.jp
入力データを用意するサンプルデータを確認する前回はセグメンテーション分析の理論編として、セグメンテーション分析と代表的なクラスタリングアルゴリズムであるK-MeansとCanopyクラスタリングについて解説しました。今回は、実践編として、K-MeansとCanopyクラスタリングによるセグメンテーション分析をMahoutを用いて実際に行います。なお、本連載の3回目同様、Mahoutのバージョンは現時点の最新版である0.7を対象とします。今回利用するサンプルデータは、ARFF形式[1]で顧客のRFMが記載されています。@DATA以降が、実際のデータです。サンプルデータ今回のデータは、以下のような構造になっています。 1行が顧客1人のデータを意味するカンマ区切りで、左から「R（最終購買日⁠）⁠」⁠「⁠F（購買頻度⁠）⁠」⁠「⁠M（購入金額⁠）⁠」を表す（省略） @DATA 顧
haltyt 2014/10/01
Mahout

kmeans
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx