タグ

2013年9月19日のブックマーク (2件)

  • 今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ

    (※※※続編記事書きました→「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ) 今ちょうどadtech tokyo 2013の会期中で、職場からも近い&会社から行ってこいという指示が出たということで僕も色々セッションを聞いたり企業ブースのお話を聞いたりしてる*1ところです。 ところで、いくつかのセッションの中でキーワードとして「重回帰分析」という言葉が出てきてました。ま、それ自体はこのブログでもRによるデータ分析絡みで頻出だし、ぶっちゃけありふれた手法と言って良いでしょう。やりようによっては普通にExcelでもできますし、それだけ人口に膾炙していると言って良いのかもですね。 ただし。意外にも内部のパラメータというか細かい手法の分岐というか、それこそ普通の線形モデルvs.一般化線形モデル(バリエーション多数)があることを無視して漫然と重回帰分析をや

    今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ
  • Rで複数変数のサマリをさくっと可視化する - About connecting the dots.

    変数の要約をして,だいたいの概要を把握するときって,だいたいboxplotとかみてこんなもんかーって思って,あとは相関表をだして眺めるみたいなことをよくやったりするんですけど,これが案外面倒なので,もう少し楽にできないかなって思ってました.特に相関の部分. そうしたらTokyo.R 33の@teramonagiさんのLTで紹介されていたパッケージが超便利そうだったので試してみました.パッケージ名は{PerformanceAnalytics}でメソッドはchart.Correlation().インストールしてaircalityデータで試してみましょう. install.packages("PerformanceAnalytics") library("PerformanceAnalytics") chart.Correlation(airquality) そうしたら,以下のような散布図と回帰

    Rで複数変数のサマリをさくっと可視化する - About connecting the dots.