NTTは13日、ビッグデータ(短時間に大量生成される多様なデータ)のうち、グラフ構造を持つデータを従来の数十倍のスピードで解析できる技術を開発したと発表した。グラフ構造データとは、ツイッターなどのソーシャルメディアでヒト、モノ、場所などの情報がグラフ状に結びついた形式のデータを指す。例えば約1億人分のSNS(交流サイト)の友人関係なら、およそ3分で解析できる。従来の技術では4~6時間程度かかっ
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く