タグ

2011年11月24日のブックマーク (2件)

  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • ギリギリまで「まとめに入らない」能力 - Chikirinの日記

    会社で働いていた頃、「この人、すごいっ!」と思う人にたくさん出会いました。 中でも私が一番感心したのは、「超ギリギリのタイミングまで、まとめに入らない人たち」です。 なんでもそうですが、何かを作り上げる時には「作る」+「整える」という二段階の作業が必要です。 最初の「作る」は「中心的な価値」を生み出す作業で、 後半の「整える」は、生み出した価値をお客様に説明しやすく&売りやすくするため、細部や体裁を整え、きれいにパッケージする、みたいな作業です。 この「作る」から「整える」に移行するタイミングを「まとめに入る」と呼びます。 たとえば 10日後に締め切りの企画書があるとしましょう。 このとき、デキる人は最初の 9日間は「まとめ」についていっさい意識せず、思考をどんどん発散させて、考えることに集中します。 一方、6日目くらいからは「まとめ」を意識して「落としどころ」を探りに入る人もいます。これ

    ギリギリまで「まとめに入らない」能力 - Chikirinの日記