タグ

2014年4月3日のブックマーク (2件)

  • Rとカテゴリカルデータの操作と統計量

    欄で説明したデータ解析の方法のほとんどは、量的なデータを対象にしたものである。今月号から数回の誌面を用いてカテゴリカルデータ(categorical data)について説明を行うことにする。 我々の周りには多くの物事の性質を数え上げる計数(count)データがある。例えば、性別(男、女)、血液型(A,B,O,AB)やアンケート調査票の中の質問における選択肢などを集計したデータは、いずれも計数データである。このような計数データをカテゴリカルデータと呼び、性別や血液型などのカテゴリーをカテゴリカル変数(categorical variable, 略して変数)と呼ぶ。 カテゴリカル変数は、データの尺度によって2種類に分けることができる。1つはカテゴリカル変数が順序関係を持たない性別や血液型などのような名義((nominal)尺度データであり、もう1つはアンケート調査質問票などでよく用いられ

    k_yon
    k_yon 2014/04/03
    カテゴリカルデータと独立性の検定
  • Rによる箱ひげ図の描き方

    箱ひげ図はコマンド boxplot にて作成する。使い方は大きく分けて3通りある。ひとつ目は、boxplot(ベクトル1, ベクトル2, ベクトル3, ...) のように、各項目のデータが格納されているベクトル形式の変数を直接指定する方法、ふたつ目は、boxplot(リスト) のように、各項目のデータが格納されているリスト形式 (または、行列形式) の変数を読み込む方法、最後は、boxplot(value ~ group, data=データフレーム) のように読み込むデータフレームと項目およびそのデータを式で指定する方法である。 以下のようなそれぞれが50要素からなるデータA、BおよびCが得られたとき、箱ひげ図を描く。 0.741 0.546 0.765 0.737 0.875 0.749 0.701 0.726 0.705 0.647 0.700 0.650 0.622 0.603 0.

    Rによる箱ひげ図の描き方
    k_yon
    k_yon 2014/04/03
    箱ひげ図