タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

データマイニングに関するotani0083のブックマーク (5)

  • 分析技術とビジネスインテリジェンス

    20128月3 Python:決定木の作成 Pythonを用いたデータマイニング事例として決定木の作成をまとめる。 これまでの事例は、ある変数とある変数の一対関係が中心だった。それに対し手法は、ある目的変数に対し複数の説明変数がどのように組み合わさった関係があるのかを探索するための手法である。 決定木の強み•弱みは以下のページが参考になる。 http://scikit-learn.org/stable/modules/tree.html   上記ページはpythonのデータマイニングライブラリのscikit-learnのもので、 機能の多様さでいえばこれが一番良さそうに感じる。 ただし、結果の可視化方法まで含めた調査がスムースにいかなかったため、 機能の数はやや劣るが内容は十分にあるOrangeライブラリを用いた例を紹介したい。 scikit-learnは精度勝負の時には自由度と種類があ

  • データサイエンティストのつくり方

    スライドは、弊社の梅により弊社内の技術勉強会で使用されたものです。 近年注目を集めるアーキテクチャーである「Transformer」の解説スライドとなっております。 "Arithmer Seminar" is weekly held, where professionals from within and outside our company give lectures on their respective expertise. The slides are made by the lecturer from outside our company, and shared here with his/her permission. Arithmer株式会社は東京大学大学院数理科学研究科発の数学の会社です。私達は現代数学を応用して、様々な分野のソリューションに、新しい高度AIシステム

    データサイエンティストのつくり方
  • プライバシ保護データマイニング

    プライバシ保護データマイニング Privacy-preserving Data Mining 筑波大学大学院 システム情報工学研究科 佐久間 淳 http://www.slab.cs.tsukuba.ac.jp/members/jun/index.html 1.はじめに 個人の行動や経済活動に密接に関連した実社会情報を扱うオンラインサービスの利用が盛んになりつつあります. 近年ではスマートフォンの普及による個人の精細な地理情報や行動履歴を利用した広告モデルやSNSなどが登場しています.今後は医療/遺伝子情報や金融/資産情報など,よりセンシティビティの高いデータの活用へと議論が向うと予想されています. 個人の望まない,あるいは意図しない個人情報の流通は社会に与える影響が大きく,その取扱いは慎重を要しますが,個人にかかわる情報はサービスの個人化にはなくてはならない情報であり,プライバシ保護

  • データマイニングCROSS 2012を開催しました - #TokyoWebmining x #TokyoR x #TokyoNLP x #DSIRNLP - hamadakoichi blog

    2012/01/27(金) CROSS 2012で「データマイニングCROSS - データマイニングの実ビジネス・サービス活用と展望」を開催しました。 TokyoWebmining 主催の濱田晃一(id:hamadakoichi : [Twitter:@hamadakoichi])とTokyo.R主催の里洋平(id:yokkuns : [Twitter:@yokkuns])がモデレータを行い、TokyoNLPやDSIRNLPコミュニティ、医療・広告・検索・マーケティング・金融工学など各分野、幅広い方々に登壇して頂きました。 会場拡張を3回したにも関わらず満員で立ち見がでるほどの盛況で、多くの方々に参加して頂け嬉しく思っています。 来場して下さった方々それぞれが、セッションの内容を受けて、それぞれのサービス・ビジネスをよりよいものとしていく。それにより日中、世界中の人々へよりよいサービス

    データマイニングCROSS 2012を開催しました - #TokyoWebmining x #TokyoR x #TokyoNLP x #DSIRNLP - hamadakoichi blog
  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • 1