タグ

統計とRに関するhonehonerockのブックマーク (3)

  • 可視化で理解する「負の二項分布」 - ほくそ笑む

    みどりぼんでカウントデータの過分散対策のために使われると書かれている負の二項分布ですが、Wikipediaの説明を読んでもよく分かりません。 そこでおススメなのが、このスライドです。 負の二項分布について from Hiroshi Shimizu ようするに、負の二項分布は、 がガンマ分布に従うようなポアソン分布だと思えばだいたい OK みたいです。 今日はこれを可視化してみます。 負の二項分布(Negative Binomial Distribution) 負の二項分布はパラメータを 2つ持ちます。成功回数を表す と成功確率を表す です。 統計言語 R には負の二項分布に従う乱数を生成する関数 rnbinom() があり、これらのパラメータはそれぞれ引数 size と prob に対応しています。 したがって、, の負の二項分布は次のようにして描画できます。 negative_binom

    可視化で理解する「負の二項分布」 - ほくそ笑む
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
    honehonerock
    honehonerock 2015/04/15
    Rで使えるデータセットのまとめ。
  • Rのグラフィック作成パッケージ“ggplot2”について|Colorless Green Ideas

    はじめに Rには、“ggplot2”というライブラリがある。このライブラリを使うと、デフォルトの作図コマンドよりも効率的に作図ができ、しかも分かりやすくて美しい図を描くことができる。美しい図といってもピンと来ないかもしれないが、百聞は一見にしかず、下の2つの図を比べてもらいたい。1つ目の白い背景の図がRのデフォルトの作図コマンドで作成された散布図である。2つ目の灰色の背景の図が“ggplot2”を使った散布図である。 Rのデフォルトの作図機能を使った場合の散布図の例 “ggplot2”を使った場合の散布図の例 以下では、“ggplot2”のコンセプトと簡単な作例を紹介したいと思う。最初は抽象的な話をする。このため、最初から読んで分かりづらかったら、後の方の作例を先に見た方が理解が早いかもしれない。 “ggplot2”のコンセプト “ggplot2”は、どのように作図を行っているのであろうか

    Rのグラフィック作成パッケージ“ggplot2”について|Colorless Green Ideas
  • 1