タグ

2017年10月24日のブックマーク (3件)

  • scratch-R: generalized linear models

    オプションについて詳しくは help(glm) や help(family) を見よう。 ここでは一般線形モデルのうちロジスティック回帰、ポアソン回帰、生存時間分析について紹介する。. ロジスティック回帰 ロジスティック回帰は連続量である予測変数から2値変数を予測するときに用いる。制約が少ないので判別分析よりも好まれる。予測変数にカテゴリカル変数を含めることもできる。 # データとspss結果はuclaのサイトから。感謝。 # 以下も参考: R Data Analysis Examples Logit Regression # データ準備 library(foreign) dat <- read.spss("http://www.ats.ucla.edu/stat/data/hsb2.sav", to.data.frame=T) names(dat) <- tolower(names(da

    scratch-R: generalized linear models
    mahler-5
    mahler-5 2017/10/24
  • Rと生存時間分析(2)

    [連載] フリーソフトによるデータ解析・マイニング 第37回 Rと生存時間分析(2) 1.セミノンパラメトリックモデル (1) コックス比例ハザードモデル イベントに影響を及ぼす複数の因子 (共変量) の影響を解析することを前提としたノンパラメトリックモデルをセミノンパラメトリックモデルと呼ぶ。最も広く用いられているモデルはコックス比例ハザードモデル (Cox proportional hazard model) である。 2つのハザード (瞬間死亡率) 関数h1 (t )、h2 (t ) が、すべて可能なt > 0 に対し、関係式h1 (t ) = ch2 (t ) が成り立つとき、2つのハザード関数は比例すると言う。関係式の中のc は時間t と無関係な定数である。 共変量x = ( x1 , x2 , … , xm )T を持つハザード関数をh (t |x ) とし、x を変数とする関

    mahler-5
    mahler-5 2017/10/24
  • 「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ - 六本木で働くデータサイエンティストのブログ

    先日の記事はおかげさまで好評をいただいたんですが、勉強中の身で教科書を確認せずに書いたこともあり多数ツッコミをいただきました。ツッコミをいただけるというのはもちろん大変良い勉強の機会になるということで*1、今回もひとしきり勉強してみました。 ということで、自戒も込めて備忘録的に勉強したことをまとめておこうと思います。今回はあまり広く読んでもらう内容ではないので、不親切かもしれませんがごめんなさい。ただし、あまりにも理論的側面ばかり色々書いても何なので、インターネット広告業界の言葉で喩えて言うなら「クリック数*2をモデリングしたい場合」と「コンバージョン数*3をモデリングしたい場合」とに分けた、と理解してもらえたら良いかなと思ってます。 今回も参考文献は久保です。一般化線形モデルまわりではこのより分かりやすいは依然としてないと思います。 データ解析のための統計モデリング入門――一般化線

    「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ - 六本木で働くデータサイエンティストのブログ