[B! clustering] alfaladioのブックマーク

alfaladio id:alfaladio

clusteringに関するalfaladioのブックマーク (4)

クラスタリング
alfaladio 2010/06/23
ruby

clustering

K-means

階層的クラスタリング

ウォード法

ピアソン相関係数

クラスタリング
リンク
階層型クラスタの作成 - kj-ki’s blog
ついに本題に入ります．今回やること「集合知プログラミング」の3章で使われている，単語の頻度がファイルになっている"blogdata.txt"を使って，階層型クラスタを作成します．得られる結果はp.47にあるデンドログラムと同じになるはずですが... blogdata.txtの読み込み blogdata.txtはTSV(Tab Separated Values)になっています．このファイルを読み込み，URLをキーにしたHashに格納します． def blog_data_from(file) word_counts = {} lines = File.open(file, 'r').readlines # 先頭行を読んで，単語の配列を作る words = lines.shift.chomp.split("\t") words.delete('Blog') lines.each do |
alfaladio 2010/06/23
ruby

MachineLearning

機会学習

clustering
リンク
IIR の階層的クラスタリングを試す (nakatani @ cybozu labs)
Pathtraq で Web ページの自動分類を手がけてみて。 Web ページは日々どんどん変わっていくのでフィルタは常に更新されなければいけないんですが、そのためには適切なタイミングに、適切な学習データを用意しなければならない。大変。メンテナンスフリーが理想ですが、もちろん難しい。現実的なところとしては「追加学習が必要なことを検知して、適切な学習データの候補を提案してくれる」というものが作りたいなあ……などなど考えているわけです。そこらへんも含めて、自然言語処理とか機械学習とかそこら辺のお勉強をしてるんですが、実際に手を動かさないとわかんないですよねー。というわけで、 "Introduction to Information Retrieval" の Chapter 17 "Hierarchical clustering" に沿って、ドキュメントの分類器を作ってみました。ポイン
alfaladio 2010/06/23
クラスタリング

学習

clustering

ruby

learning

言語処理
リンク
軽量データクラスタリングツールbayon - mixi engineer blog
逆転検事を先日クリアして、久しぶりに逆転裁判1〜3をやり直そうか迷い中のfujisawaです。シンプルなデータクラスタリングツールを作成しましたので、そのご紹介をさせていただきます。クラスタリングとはクラスタリングとは、対象のデータ集合中で似ているもの同士をまとめて、いくつかのグループにデータ集合を分割することです。データマイニングや統計分析などでよく利用され、データ集合の傾向を調べたいときなどに役に立ちます。例えば下図の例ですと、当初はデータがゴチャゴチャと混ざっていてよく分からなかったのですが、クラスタリングすることで、実際は3つのグループのデータのみから構成されていることが分かります。様々なクラスタリング手法がこれまでに提案されていますが、有名なところではK-means法などが挙げられます。ここでは詳細については触れませんが、クラスタリングについてより詳しく知りたい方は以下の
alfaladio 2010/06/12
クラスタリング

プログラミング

アルゴリズム

clustering

programming

algorithm

ツール
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx