タグ

ブックマーク / www.housecat442.com (4)

  • Factorization Machinesのおはなし。 | 分析のおはなし。

    最近の投稿 「施策デザインのための機械学習入門」というデータサイエンスの起爆剤 データ分析との出会い 5 色々挑戦した2019年だった いったい何のためのモデルなのか? 「サルたちの狂宴」を読みました。 アーカイブ 2021年8月 (1) 2020年2月 (1) 2019年12月 (1) 2018年12月 (1) 2018年9月 (1) 2018年2月 (1) 2017年6月 (2) 2017年5月 (1) 2017年3月 (1) 2017年2月 (1) 2017年1月 (2) 2016年10月 (1) 2016年8月 (1) 2016年7月 (2) 2016年2月 (3) 2016年1月 (3) 2015年12月 (1) 2015年11月 (2) 2015年9月 (2) 2015年8月 (2) 2015年7月 (2) 2015年3月 (2) 2015年2月 (2) 2015年1月 (2)

  • 機械学習で広告の効果を推定したいお話。 | 分析のおはなし。

    アメリカへの交換留学とノルウェーへの大学院留学を経た後に、データサイエンティストを目指そうとする人の戯れ言。 こんばんは。 数学ができなくて悩む今日この頃です。 が、データ分析数学そのものでは無いので気にせずコツコツやっていこうと思う今日でもあります。 さて、 Japan.Rで発表してまいりました。 内容は「機械学習を使って広告の効果を推定する」という予測モデルを使って因果推論を試みる内容でした。 今回は内容の補足と解説を書きます。 発表した資料はこちらです。 1. Hal Varianのアプローチ そもそもこのトピックに興味を持ったのは Varianの書いた Big Data: New Tricks for Econometricsというペーパーと、 それに影響を受けたNBERのDemand Estimation with Machine Learning and Model Comb

    機械学習で広告の効果を推定したいお話。 | 分析のおはなし。
  • AWSにRStudio入れてからkaggleのデータを読み込む話。 | 分析のおはなし。

    アメリカへの交換留学とノルウェーへの大学院留学を経た後に、データサイエンティストを目指そうとする人の戯れ言。 さびびさにRの話です。 仕事でこの先AWSから逃げれないなと思ったので、生活に取り入れようと決心した今日この頃。 とりあえず自分のPCのメモリに載らないデータを扱う決心をすれば必要性が生じるのでkaggleのclick-through competitionのデータを使って何かしてみようと決めた訳です。 という事でこの辺を参考にしながらやってみました。 1. AWSのアカウントを取る。 とってくださいw 2. AMIがあるので見つける。 こちらのサイトへ行くと右側にrstudioのAMIを利用してAWSを立ち上げる画面へのリンクが置いてあるので、立てたいリージョンのリンクをクリックする。 あとは、ポチポチやっていけばr-studioがインストールされた状態のものが立ち上がる。 ちな

    AWSにRStudio入れてからkaggleのデータを読み込む話。 | 分析のおはなし。
  • Gradient Boosting Decision Treeでの特徴選択 in R | 分析のおはなし。

    Gradient Boosting Decision Tree(GBDT)を勉強したので、その概要とRでのパッケージの簡単な使い方を乗っけておきます。 1. そもそもGBDTってなんだよっていう話。 単純に言えば、複数の決定木を作成して、集団で学習させる方法の事です。 1決定木を作り、上手くモデルで説明が出来なかったobservationに対して重みを付け、重みのついた状態で次の木を作り、また重みを付けて・・・ というステップを指定した数分だけ繰り返します。 誤差に対して学習しなおしてくれるので、決定木よりもっと良いモデルが出来上がります。 理論の詳細はこちらのを参考にしていただければと。 英語版は著者サイトで無料公開されています。英語大丈夫な人はこちらを参照するとよいかと。 http://statweb.stanford.edu/~tibs/ElemStatLearn/ あとこのイ

    Gradient Boosting Decision Treeでの特徴選択 in R | 分析のおはなし。
    horihorio
    horihorio 2015/01/30
  • 1