タグ

statisticsとcontigency-tableに関するnabinnoのブックマーク (3)

  • 分割表 - Wikipedia

    この表で、右端の列を行周辺合計 (row marginal total) 、下端の行を列周辺合計 (column marginal total) と呼び、右下端の角にあたる部分を総計 (grand total) と呼ぶ。 この表から、男性の右利きの割合と女性の右利きの割合には大差がないことが一見してわかる。しかし、両者は全く同じではなく、その差が有意かどうかは表内の各エントリが母集団からの無作為抽出であるとして、帰無仮説についてカイ二乗検定、G検定、フィッシャーの正確確率検定といった仮説検定を行うことで確かめることができる。表の各行や各列について割合が異なる場合、その表は2つの変数間の「付随性」(contingency) を示していると見ることができる。付随性がない場合、2つの変数は「独立」(independent) と見ることができる。contingency table という用語は、カ

  • ggplot2で2軸プロットをする - Qiita

    2軸プロットが欲しくなるとき y軸が左右にあるいわゆる2軸プロットはExcelなんかでは簡単に作れるがggplot2では簡単には作れない。 つまりそもそもそんなもん作るなという話だが、欲しくなる場面はある。 例として気温(℃)と相対湿度(%)と飽差(Pa)をプロットする場合を挙げよう。飽差は気温と相対湿度から算出できる数値で、「乾きやすさ」の指標と考えてもらえればいい。 日常的な環境では、3つの変数のうち相対湿度が最も大きく変動するので、これらを1枚に収めると相対湿度の変動だけが目立ってしまう。したがって、相対湿度だけ第2軸に移してなんとかしたい、という動機が生ずる。 使用データ 上述の気温、相対湿度、飽差をプロットする例を想定し、次のように作成した。 ## function ---- svp <- function(t){ # 飽和水蒸気圧計算 Alduchov and Eskridge

    ggplot2で2軸プロットをする - Qiita
  • クロス集計とカイ二乗検定 - Qiita

    import pandas as pd # タブ区切りのテキストデータを読み込む data = pd.read_csv("data.txt", sep="\t") # クロス集計をする crossed = pd.crosstab(data.A, data.B) #=> # A B #store_1 435 165 #store_2 265 135 クロス集計表ができました。 2 つの変数の関連において、どちらかの変数が、もうひとつの変数の原因となっている場合に、原因となる側の変数を 独立変数 (independent variable) 、もう一方の結果となる変数を 従属変数 (dependent variable) と言います。これは 2 変数の間に因果関係があると考えられるときに生じます。つまりクロス集計表で提示されるのは、原則として独立変数の側を基準とした各カテゴリーの値です。 科学

    クロス集計とカイ二乗検定 - Qiita
  • 1