[B! データマイニング][研究] nextbigthingのブックマーク

nextbigthing id:nextbigthing

データマイニングと研究に関するnextbigthingのブックマーク (3)

Tutorial_ja - bayon - Google Code
Code Archive Skip to content Google About Google Privacy Terms
nextbigthing 2012/03/27
クラスタリング

bayon

研究

データマイニング
リンク
データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します（この論文は@doryokujin君のポストで知りました、ありがとうございます！）。必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
nextbigthing 2011/11/24
データマイニング

研究
リンク
類似度と距離 - CatTail Wiki*
２つのデータが似ている度合いを，類似度の大きさや距離の近さといった数値にしてあらわすことで，クラスタ分析や，k-近傍法，多次元尺度構成法(MDS)をはじめとするいろいろな分析を行うことが可能となる．ここでは，よく知られている類似度や距離について述べる．類似度という概念は，２つの集合の要素がまさにどれだけ似ているかを数量化したものであり，距離とは，要素同士の離れ具合，従って非類似度とちかい概念と考えてもよい．参考までに数学における距離の概念の定義を示すと，距離空間の定義 Sを１つの空でない集合とし，dをSで定義された2変数の実数値関数 d(SxS)　→　R が，以下の４条件（距離の公理） D1 ：（非負性）　任意のx,y∈Sに対して d(x,y)≧0． D2 ：（非退化性）　x,y∈Sに対し d(x,y)=0 　⇔　x=y． D3 ：（対称性）　任意のx,y∈Sに対して d(x
nextbigthing 2011/10/19
研究

データマイニング

クラスタリング

類似度

algorithm
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx