タグ

logarithmに関するoanusのブックマーク (7)

  • 対数変換と一般化線形モデル - DTAL(旧RCEAL)留学記録

    免責事項 以下は私がここ一ヶ月強ほどで学習した内容ですので、誤っている可能性があります。誤りを発見された方はご指摘を頂けると嬉しいです。 主旨 Rで以下の二者は同一のモデルを構築すると思っていたのが、間違っていましたという話です。 1. lm(log(y) ~ x) 2. glm(y ~ x, family = gaussian(link = log)) 背景 必要があり、指数関数()あるいは冪関数()に従う二変量(xとy)をRでモデル化する方法について調べていました。 私のこれまでの理解は、以前は変数変換を施すことにより誤差を正規分布に近づけ、それに最小二乗法に基づく線形モデルを当てはめていたのが、近年では一般化線形モデルを用いることにより正規分布以外の誤差も扱えるようになり、そちらを使うことが多い、というものでした。つまり一般化線形モデルが変数変換に取って代わったと思っていました。しか

    対数変換と一般化線形モデル - DTAL(旧RCEAL)留学記録
  • log 変換する?しない?AICでモデル比較するときの注意点 - ほくそ笑む

    データを分析にかける前に、出力変数を log 変換する、というのはよくあることだと思います。 次のデータを見て下さい。 このデータ、線形モデルに当てはめる前に log 変換したほうがよさそうだなーというのが見てとれます。 それもそのはず、このデータは次のように作っています。 N <- 100 x <- runif(N, min = 1, max = 2) y <- exp(x + rnorm(N, sd = 0.3)) data <- data.frame(x, y) それでは、log 変換しないバージョンと、するバージョンでモデルを作成して、AIC を比較してみましょう。 model <- lm(y ~ x, data) model.log <- lm(log(y) ~ x, data) aic <- AIC(model, model.log) print(aic) ## df AIC

    log 変換する?しない?AICでモデル比較するときの注意点 - ほくそ笑む
  • サービス提供終了のお知らせ

    日頃より、Momoたろうインターネットクラブをご愛顧いただきまして誠にありがとうございます。 「ホームページサービス」のサービス提供は2015年11月30日をもちまして終了させていただきました。 これまで長らくご利用いただき、誠にありがとうございました。 今後も、皆様によりよいサービスをご提供させていただけるよう、サービス品質向上に努めて参りますので、何卒、ご理解いただけますようお願 い申し上げます。 <Momoたろうインターネットクラブをご契約のお客様へ> 後継サービスとして「userwebサービス」を提供させていただいております。 詳しくは、以下のリンクをご参照ください。 ▼「userwebサービス」のご案内 http://www.ejworks.info/userhp/mmtr/index.html 今後ともMomoたろうインターネットクラブをご愛顧いただけますようお願い申し上げます

  • [統計]対数正規分布しかし平均値・・・続 - 馬車馬のように

  • [統計]対数正規分布しかし平均値・・・ - 馬車馬のように

    データが対数正規分布(あるいはそれに近い)と来れば、対数変換して変換した後の値をデータと見て分析する、というのが伝統的な常套手段だった。ある程度複雑なモデルを扱う道具には事実上、ほとんど正規線形モデルしかなかったことを考えると、対数正規分布を対数変換した後の値は(当たり前だが)正規分布するから、その点でも調子がよさそうである。 しかし、元のデータ(対数変換する前)と対数変換した後では、平均値の大小は一致するとは限らない(このことは以前にも書いた)。もとの値での平均値を問題にしたいのなら、対数変換が不都合であることは生態学でのデータ解析にたずさわってきた人々が経験してきたところだろう(比較的新しいところでは生物科学の久保拓弥さんの解説を参照)。 では、データが対数正規分布で、もとの値での平均値を問題にしたいときには手も足も出ないのかと言うと、そんなことは別にない。たとえば、あまりに単純と言わ

    [統計]対数正規分布しかし平均値・・・ - 馬車馬のように
  • [統計]対数変換 - 馬車馬のように

    観察(観測)の結果、得たデータがどうも分析方法の”要求”にあわないため、データの何らかの関数をデータの代わりに分析することはわりと多く行われている(もちろんどんな関数でもいいわけではない。ある関数がある現象に使われ始めたときはたいてい理由があるのだが、ときには理由が忘れられ慣性で持続していることがあるーその狭い分野の外部の人から見ると呪文化していることになる)。 データの何らかの関数をデータの代わりに使う方法を、変数変換といい、生物関係だともっとも多いのはデータの対数を使う対数変換だろう(他にも私の仕事の種でもある角度変換=逆正弦平方根変換などあり)。この対数変換というものはそれほど扱いやすくはない。なお、対数は正の値でないととれないから、以下は全部正の値の話である。 対数にしてもそのままでも大小は変わらない。つまりx>yならlog(x)>log(y)である。これは対数関数が単調増加だから

    [統計]対数変換 - 馬車馬のように
  • 正しい変数変換法

    論文: Yamamura, K. 1999. Transformation using (x + 0.5) to stabilize the variance of populations. 掲載誌:Researches on Population Ecology 41: 229-234. [PDF (142KB)] (Copyright by the Society of Population Ecology and Springer-Verlag Tokyo) The original publication is available at http://www.springerlink.com いくつかの環境で生物の個体数が異なっているかどうかを判定するとき,分散分析を行ってその違いをきちんと判定しなければならない。ただし,分散分析にかける前に,その前処理として「対数変換 log

  • 1