[B! データマイニング] yamataku13のブックマーク

yamataku13 id:yamataku13

データマイニングに関するyamataku13のブックマーク (10)

ディープラーニングチュートリアル応用編
Transcript 1. 大規模データから単語の意味表現学習-word2vec ボレガラダヌシカ博士(情報理工学) 英国リバープール大学計算機科学科准教授 2. 2 2005 2008~10 学部修士博士助教/講師東京大学工学部東京大学大学院情報理工学系文書自動要約における重要文順序学習同姓同名抽出別名抽出属性類似性計測関係類似性計測評判分類の分野適応関係抽出の分野適応進化計算を用いたWeb 検索結果順序学習ソーシャルネットワークの関係予測対話型協調 Web検索エンジン潜在関係検索エンジン自己紹介専門分野：自然言語処理, 機械学習,データマイニング 2006~07 2010~13 2010~現在准教授リバープール大学深層学習 3. 今回の講演の背景 •深層学習に関する活動 •2014年9月に深層学習のチュートリアルをCyberAge
yamataku13 2015/04/17
データマイニング

機械学習
リンク
サービス終了のお知らせ - NAVER まとめ
サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。
yamataku13 2014/04/28
まとめ

データマイニング
リンク
Clojure/Incanter/clj-mlでデータマイニング入門 - あんちべ！
概要 Clojureでデータマイニングに必要な各手法を解説する記事です。本記事を読むと、全くClojureを知らない方でもデータ抽出・集計可視化機械学習（決定木、ランダムフォレスト、k-meansクラスタリング) をClojureで実行できるようになります。はじめに ClojureとはJVM上で動く（つまりOSを問わず沢山の環境で動く上に Java資産をそのまま使える）Lisp系の言語です。 Clojureではデータマイニングを行う際、 Incanterとclj-mlという2つの便利なツールがあります。 Incanterは統計処理用の専門ライブラリで、単体で様々な統計分析を行ったり集計を便利にしたりする機能が沢山用意されています。 clj-mlはwekaという機械学習系のツールをClojureで簡単に使えるようにしたラッパーで、決定木やランダムフォレストなどの分類器や各種ク
yamataku13 2014/02/16
データマイニング
リンク
Webデータ分析＆データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。主に自分向けのまとめという意味合いが強いんですが（笑）、僕が実際に2013年6月現在webデータ分析＆データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。追記回帰分析（特に線形重回帰分析）独立性の検定（カイ二乗検定・フィッシャーの正確確率検定）主成分分析(PCA) / 因子分析クラスタリング決定木 / 回帰木サポートベクターマシン(SVM) ロジスティック回帰ランダムフォレストアソシエーション分析（バスケット分析・相関ルール抽出）計量時系列分析おわりにおまけ1：「素性ベクトル＋分類ラベル」なるデータ前処理おまけ2：グラフ理論*10 {igraph}パッケージでグラ
yamataku13 2013/06/11
分析

データマイニング
リンク
Web系女子がLispと出会って統計学に目覚めるまでのお話 - あんちべ！
こんにちは！今年の春からWeb系企業でHTML/CSSデザイナーとして働きだしたキラキラ女子（を目指してる）のあんちべ（23）です！よろしくお願いします！私は普段自社のWebサービスのCSSなどを書いている*1のですが、最近データマイニングに興味を持ち始め、データを分析して、自社サービスの売り上げ改善に貢献したいなーと思うようになりました！でも。。。私は文系出身で統計学とか全然わからない*2し、プログラミングも得意じゃない*3し、高価な統計解析ソフトを買うのも辛いです。。。無い無い尽くしですね＞＜；！そんな私に救いの手が！インストール作業不要で、便利な統計処理機能が色々あって、しかも無料という素晴らしいソフト*4を発見しました！その名も"Incanter"です！なんでも、 Lispっていう古くから使われてきた実績のあるプログラミング言語で動いてて、Lispの文法でどんな処理をすればよいかを
yamataku13 2012/12/12
プログラミング

統計学

lisp

データマイニング
リンク
データマイニングを仕事にする人の生態系 - dataminer.me
「データマイニングを仕事とする人＝データマイナー」はどういう人たちがいるかということについてビックデータとかで世の中がバズってるけど「僕はデータマイニングをやってます！」といったときに適切にその人がやっている業務領域を把握している人ってかなり少ないと思う。グリーで働いていたときもデータマイナーはどういった仕事をしていて、何をやっていて何ができるのかっていうことを理解していなくてミスコミュニケーションが生まれていたと思うのでちょっとその生態系についてまとめてみた。おそらく、データマイナーといわれる人は以下のタイプがいる：研究開発をする人統計学的に新しいイノベーションを起こせる人。Google のPageRankアルゴリズムを作りましたとか、NetfrixやAmazonのレコメンデーションエンジン作りましたとかいう人がこれにあたる。スキル的には統計学にかなり長けている必要があり、その他
yamataku13 2012/10/24
データマイニング

エンジニア
リンク
ビッグデータに飛びつく前に理解しておきたいデータ分析手法：日経ビジネスオンライン
気になる記事をスクラップできます。保存した記事は、マイページでスマホ、タブレットからでもご確認頂けます。※会員限定無料会員登録詳細｜ログイン最近、ビッグデータが注目をあつめている。大規模記憶装置としてのデータウエアハウスとコンピューターの計算能力の急速な発達に伴って、今まではほとんど不可能に近かった、大量のデータを用い大量の計算を瞬時に成し遂げることが可能になり、経営戦略そのものに多大な影響を与えるようになった。自社に蓄えられた膨大な顧客のデータをなんとか新たな購買力に結びつけるアイディアを出せと、部下に檄を飛ばしたり、ビッグデータを標榜するコンサルティング会社に相談を持ちかけたりしている経営者も多いのではないかと思う。今回は、そういった経営者の方々や、ビッグデータに何らかのかかわりを持つ方に、ビッグデータに飛びつく前に、これだけは念頭に入れておいて頂きたい2、3の重要事項を述
yamataku13 2012/09/13
ビッグデータ

データマイニング
リンク
Treasure Data Platform で始めるデータ分析入門〜8. Data Visualization Patterns 〜 Part.1 - doryokujin's blog
Treasure Data Intro for Data Enthusiast!! from Takahiro Inoue 本シリーズではデータ分析を以下の7つのレイヤーに分解し，各々について解説していくものとします。（Slide Shareの資料は常時更新されます。） Data Collection Data Storage Data Management Data Processing Data Processing Design Part.1 Part.2 Part.3 Part.4 Part.5 Part.6 Data Visualization Treasure Viewer, MetricInsights, Tableau Data Visualization Patterns Part.1 Part.2 Part.3 本日は「7. Data Visulizations」の全
yamataku13 2012/07/17
データマイニング

statistics

ライブラリ
リンク
データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します（この論文は@doryokujin君のポストで知りました、ありがとうございます！）。必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
yamataku13 2011/11/24
データマイニング
リンク
「テキストマイニングを使う技術/作る技術」を読んだ - EchizenBlog-Zwei
自然言語処理は大学時代からやっていたのだが、恥ずかしながらテキストマイニングについてはよくわかっていなかった。@shima__shima先生から「テキストマイニングを使う技術/作る技術」を紹介していただいたので読んでみた(紹介していただき、ありがとうございました)。本書によるとテキストマイニングは厳密な定義はないものの、テキストデータから抽出されたデータを用いたデータマイニングを指すらしい。で、従来のデータマイニングであれば数値データからそのままマイニングすればいいけれどテキストデータは自然言語で書かれていてそのままでは使えないので自然言語処理(NLP)を用いてマイニングで使うデータを抽出するよ。ということらしい。なんとなくNLPの中にテキストマイニングがあるのかと思っていたのだが、テキストデータとデータマイニングの橋渡しをする技術としてNLPを使っている、というのが正しいのかも。本
yamataku13 2011/10/03
データマイニング
リンク
1