タグ

rに関するDiomedeidaeのブックマーク (104)

  • Rいろは・第五部:現代統計への導入(GLM、GLMMの基礎)

    Rの統計ネタは自分自身の勉強を兼ね発信しています。作成者は統計の専門家ではないので自己責任でご参照ください。ご指摘も(応援も^^)歓迎します! (cf. Rいろはのトップページ http://nhkuma.blogspot.jp/p/r_5.html) # 注:作成者は統計の専門家ではありません。内容には十分な注意を払っているつもりですが、限界があることを理解した上で参照してください。感想・苦情・間違いのご指摘、歓迎します。 (注:使用環境によっては、スペースやクオーテーションマーク"などが化けてコードがエラーになるかもしれません) ### GLM準備編 ########### # まずは古典統計を統計モデリング風に解いてみよう #(統計モデルの構築とパラメータ推定の練習) # 回帰の例(yへのxの影響が有意か、ではなく、yへのxの影響の仕方を推定する) x00 <- c(1:100) y

    Diomedeidae
    Diomedeidae 2013/10/11
    RでGLM・GLMM実行時のTipsや関数を紹介している。知らない関数があって参考になった。
  • 統計解析ログ/R作図 - 引越作業中

    このページでは、Rで作図する基的な手順を紹介したいと思います。いい図はデータ解析を助けてくれますので、ぜひ自分の思い通りの図を描けるようになってください。 Rで作図するメリット・デメリット メリット データを解析しながら作図できる 複数の図を描くときに自動化できる 様々な形式で図が出力可能(png, jpg, メタファイル, pdf, epsなどなど) 低水準作図を駆使すれば、フォーマットが決まっていない図も描ける(地図など) デメリット マウスで何か操作する訳ではないので、関数を知らないとどうにもならない 複雑な作図だとコードが長くなる 低水準作図で次々と要素を足していったときに、途中で間違えても戻れない 個人的には、複数の図が自動化ですぐにかける点と、低水準作図を駆使することでフォーマットにとらわれない図がかける点が特に便利だと思います。これらの点は、データを見る上で(ひいては統計解

    統計解析ログ/R作図 - 引越作業中
    Diomedeidae
    Diomedeidae 2013/09/25
    飯島さんのR小技集。参考にします。
  • Rのflexmixパッケージで混合分布モデルによるクラスタ分析を行う。 - Analyze IT.

    Rで混合分布クラスタリングを行うときに有名なパッケージとしてflexmixが存在します。この記事ではflexmixの簡単な使い方を解説します。 flexmix自体は潜在クラス回帰を行うパッケージなのですが、混合分布クラスタリングを行うことも出来ます。 flexmixはRのglmクラスを用いてモデルを表現出来るため、他のパッケージに比べて柔軟なモデリングが可能というメリットがあります。 そもそも、混合分布クラスタリングとはなんぞやという人は以下の文を参考にしてください。 1.モデルベースのクラスタリングとは クラスタリングは代表的なものとして、以下の3つの方法が存在します。 おそらくk-meansと階層的クラスタ分析はみなさんご存知でしょう。 分類 メリット・デメリット 手法 階層的手法 +データを樹形図として表現可能 ‐データ数が多いと、樹形図として表現できないのでデータ数が絞られる。

    Rのflexmixパッケージで混合分布モデルによるクラスタ分析を行う。 - Analyze IT.
    Diomedeidae
    Diomedeidae 2013/09/24
    混合分布のクラスタリングを行うR関数flexmixとその実施例。とても参考になります。
  • 今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ

    (※※※続編記事書きました→「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ) 今ちょうどadtech tokyo 2013の会期中で、職場からも近い&会社から行ってこいという指示が出たということで僕も色々セッションを聞いたり企業ブースのお話を聞いたりしてる*1ところです。 ところで、いくつかのセッションの中でキーワードとして「重回帰分析」という言葉が出てきてました。ま、それ自体はこのブログでもRによるデータ分析絡みで頻出だし、ぶっちゃけありふれた手法と言って良いでしょう。やりようによっては普通にExcelでもできますし、それだけ人口に膾炙していると言って良いのかもですね。 ただし。意外にも内部のパラメータというか細かい手法の分岐というか、それこそ普通の線形モデルvs.一般化線形モデル(バリエーション多数)があることを無視して漫然と重回帰分析をや

    今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ
    Diomedeidae
    Diomedeidae 2013/09/19
    GLMで使う確率分布の選択はover dispersionかどうか検討するのも(特にカウントデータの場合)大事ですよー、っと。久保さんの本もいいですし、Webサイトを読むだけでも勉強になりますよ。