MLに関するhirokikyのブックマーク (2)

  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
    hirokiky
    hirokiky 2011/11/24
  • 京大人文科学_v094

    大規模社会ネットワーク分析の事例と展望 湯田 聴夫(株式会社CREV) yuta@crev.jp 1.はじめに ∼大規模なソーシャル・データの出現∼  1998年から幕を開けた複雑ネットワーク科学の13年間の主たる成果とし て、巨大なネットワーク構造を解析可能にしたことがあげられる。インター ネット自体の物理的ネットワーク構造や、Webページのハイパーリンク構 造、生命科学においても反応物質間をリンクとした大規模構造など、膨大な データが「ネットワーク構造」を成し、1万∼数億ノードと、その巨大な構 造の把握が競われてきた。  稿で特に注目するソーシャル・ネットワーク∼社会的な人的繋がり∼の オンラインサービスにおける立ち上がり方も目覚ましいものがあった。人や 組織に注目した数理社会学には「社会ネットワーク解析」の数十年の歴史が あるが、わずか6年前、2005年前後まで分析可能な最大ノー

    hirokiky
    hirokiky 2011/11/20
    大規模社会ネットワーク分析の事例と展望
  • 1