特徴 familyはbinomialとpoissonが使える Random effectは一個しか指定できない Random effectの指定方法 > result <- glmmML(formula, family=**, cluster=**, data=**)
データ解析をしているときに常に悩ましいのが外れ値の存在です。そもそも外れ値とは、次のような原因で起こっていると考えられます。 データミス ミスではなくて本当に外れている 集団の中で異質な観測値 データミスの場合は取り除いたり、修正したりします。本当に外れ値の場合は次のような処理をすることが考えられます。 取り除く(データを均質にするため) 「極端に大きい」または「小さい」という情報を残すためウィンザライゼーション(winzorization)を行う ウィンザライゼーション:上限・下限の閾値を決めてその値に置き換える そのまま使う 線形モデルを当てはめるときは、結果変数yが正規分布に従っているという仮定を置いています。しかし説明変数xには何も仮定してませんので、外れ値を気にせずそのまま使うというのも選択肢の一つです。ですが「異質な観測値」であることは間違いないので、モデルのパラメータ(傾き)
小ネタな上に詰め切れていないですが載せてしまいます。 今やっている解析で差し迫って気になったので検証を試みてみました。さしあたりGLMMでランダム要因とした時の、各カテゴリーの値の推定が悪くないことが示せれば十分だったので、このまま放置するかもです… カテゴリー要因の各値の推定は普通はANOVAでやるわけですが、カテゴリーが不特定多数だったり、各カテゴリーの値そのものには興味がない場合には(測定条件の人為的誤差などのアーティファクトであったり)、ランダム要因に指定してやると、各カテゴリーの値は分散のパラメータひとつを推定した結果として副産物的に求められると考えています。一方、ANOVAの場合は、カテゴリーの数だけ推定すべきパラメータ数が増えてきて、だんだん気持ち悪いモデルになりますね。 普通に考えると、パラメータ数をちゃんと使っているANOVAの方が複雑ではあれど、各パラメータの推定はよい
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く