タグ

2011年11月24日のブックマーク (2件)

  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
    ryoubi
    ryoubi 2011/11/24
    めもめも : データマイニングで使われるトップ10アルゴリズム -
  • アソシエーション分析(あそしえーしょんぶんせき)

    POSデータ(注1)などの巨大なデータベースから、価値あるアソシエーション・ルール(注2)を抽出するデータマイニング(注3)・テクニック。マーケットバスケット分析(注4)に利用される。 アソシエーション・ルール抽出(association rule extraction)、アソシエーション・ルール・マイニング(association rule mining)、アソシエーション・ルール発見(association rule discovery)などともいう。 小売業のPOSシステムでは、日々大量のトランザクションデータが生み出されている。この中には、「パンとバターを購入した取引の90%がミルクも購入している」といった法則が秘められているが、中規模の小売店舗でも商品アイテム数は数千から数万に及び、その組み合わせ(アソシエーション・ルール)は無数にある。そのため、どの組み合わせが価値ある法則であ

    ryoubi
    ryoubi 2011/11/24
    “代表的なアルゴリズムであるアプリオリ(Apriori)アルゴリズムは、信頼度(confidence:確信度とも)と支持度(support:サポートとも)に基づいてルールを評価する。”:アソシエーション分析 -