タグ

2016年11月22日のブックマーク (1件)

  • 因子Tips大全 - RjpWiki

    因子 Tips 大全 前置き:初級Q&Aでデータフレーム中の因子変数の件で悩まれていた方がいらしたので、関連知識をまとめてみました。確かに、因子は実体とその見掛けの表現が異なるという意味で、困惑させられる概念です。要するに、表と同じく値が同じケースをグループ(カテゴリー)化するわけですが、各グループの代表値が水準集合で別個に保管・表現されているわけです。 Rの因子(factor)は整数値ベクトルの一種類と考えられるが,その真の値は対応する水準ベクトル(文字列ベクトルです)に より間接的に表現される.結果として、同じ値を持つケースがグループ化されるとともに、大きなサイズの文字列変数の保管メモリを少なくする効果もある。データフレーム中の文字列変数は原則因子として扱われる. 因子は統計モデル関数で特に重要(help(contrasts)参照)になる. ベクトルを因子にする factor()† 関