AlgorithmK-means法は、入力データからK個のランダムな個体を初期クラスタの中心として選択し、以降、クラスタの重心を移動させるステップを繰り返すことでクラスタリングを行う非階層的手法です。K-means法はシンプルで高速ですが、初期値依存が大きいのが弱点... 続きを読む
The open source clustering software available here implement the most commonly used clustering methods for gene expression data analysis. The clustering methods can be used in several ways. Cluster 3.0 provides a Graphical User Interface to a... 続きを読む
Description python-cluster is a package that allows grouping a list of arbitrary objects into related groups (clusters). Simply give it a list of data and a function to determine the similarity between two items and you're done. Project homep... 続きを読む
Programming Collective Intelligence: Building Smart Web 2.0 Applications作者: Toby Segaran出版社/メーカー: Oreilly & Associates Inc発売日: 2007/08メディア: ペーパーバックいわゆる「集団知」を求めるためのプログラミングについて書かれた本のようだ... 続きを読む
今回は Classifier (分類器)についての歴史です。 前回は、Model, Optimization, そして、Featureの話でした。 この三つを知らないと話がわからないので注意。 ふたたび、x を見て、y を予測したいとします。 例えば、x はパスポートの写真。 y は性別と... 続きを読む
HLT, COLT, ICML, Coling-ACL, EMNLPで、機械学習の視点から見て大事そうだな、と思った論文について書きます。 自然言語処理の分野で使えそうな structure のある話にバイアスがかかっているので悪しからず。 他にも良い論文はいっぱいありました。=======un... 続きを読む
しばらく、資料集の紹介だったので、ここらへんで専門に勉強しない人に向けた機械学習についての解説をすこしだけします。 主なタスクは、以下の様なものです。 (1) Supervised 訓練用にサンプルを用意して、機会に学習させた後、テスト用の別なサンプルでど... 続きを読む
2007-02-19 言葉を分類する Clustord 言葉を分類するcgi「Clustord - Clustering words」。 まず、分類したい言葉を半角空白区切りで入れます。 んで、実行。 すごいなあ。 この元ネタDBが欲しいw via llameradaの日記 - 複数の単語を似た意味に分類するサービ... 続きを読む
R の多変量解析オブジェクトの簡易説明 R の基本パッケージ stats には、階層的クラスタリング、 主成分分析、因子分析、正準相関、多次元尺度法等の古典的多変量解析手法用の関数がある。 もう一つの代表的手法である判別分析用の関数は、代表的なアドオンパッ... 続きを読む
■kookleの階層構造作成アルゴリズムをひらめいた 今まで、いかにも適当なヒューリスティクスに従ったアルゴリズムで階層構造を作っていたわけですが、もうちょっとまともな、数学とかのアイデアをベースにする方法をふとんの中で考えてて思いついた。 詳細は言... 続きを読む