タグ

ブックマーク / www.anlyznews.com (4)

  • 一般化線形モデルにこだわりすぎ

    先日、問題点を指摘してみた一般化線形モデルに関する記事の補正記事『「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ』のエントリーが出ていた。 一般化線形モデル(GLM)をクリック数やコンバージョン数に適応する上での注意事項を考察したもので、その内容に大きな問題があるわけではないし、タイトルにこめられた意図も同意できるモノだ。しかし、モデル選択を考える上でGLMにこだわる必要があるのかと言うそもそも論が気になった。 1. 一つの推定モデルに複数の手法が適用できる どういう事かと言うと、推定モデルがまずあって、それの計算方法を選択すると考える方が順当だと思うと言う事だ。極端な事を言うと、y = Xβ + εと言う線形モデルを考えたときに、最小二乗法で推定してもいいし、最尤法で推定してもいいし、最尤法をNR法で実行しても、BHHH法で実行しても、MCM

    一般化線形モデルにこだわりすぎ
    klov
    klov 2015/06/13
  • 銀座で働くデータサイエンティストのモデル選択について

    『今さら人に聞けない「重回帰分析の各手法の使い分け」 』と言うブログのエントリーがあって、一般化線形モデル(GLM)の使い分け(Rの関数glmとパッケージMASS)の説明がされているのだが、理系実験室から出てきた人のせいか、色々と怪しく感じる所がある。純粋文系プログラマとして問題点を指摘してみたい。 1. 離散データだから最小二乗法が使えないわけではない 全体として、モデルの説明がおかしい。推定モデルの使い分けが良く分かってい無い気がする。問題のエントリーには、『クリック数という「カウントデータ=離散値データ」』だから『普通の線形回帰』と表現されている一般最小二乗法(OLS)は正しく推定できない可能性があるので、ポアソン回帰モデルや負の二項分布回帰モデルにしようと言っている。しかし、離散データでもプロビットのような二項/多値選択モデルであったり、切り落としのトービット・モデルで無い限りは、

    銀座で働くデータサイエンティストのモデル選択について
    klov
    klov 2015/06/12
  • ギルボア「合理的選択」は「ひたすら読む理論経済学」

    経済学は誤解されやすい学問で、よく人文科学系の人々から批判されている。 合理的な個人を仮定し、効率性を議論する所を疑問視されるのだが、合理的や効率性の意味が良く理解されていない事が少なくなく、合理的選択理論の限界について経済学者が議論していることも知られていない。 こんな勘違いな批判者が続出するのは、経済学で使う言葉の意味が理解されていないからだ。言葉の意味が知られていない理由は、二つあると思う。一つは、経済学数学を用いて体系化した学問であって、人文科学系の学者にとっつきにくい。一つは、経済評論家が理解できていない経済用語を振り回し、それから誤解が広まっている。 1. 勘違い非難を打開する救世主が現われた! どうしようも無い状況だが、救世主が現れた。イツァーク・ギルボアの『合理的選択』は、数学を使わず経済学を理解する上で必要な単語のコンセプトを説明するで、ひたすら読む理論経済学と言った

    ギルボア「合理的選択」は「ひたすら読む理論経済学」
    klov
    klov 2013/08/16
  • 統計学を勉強するときに知っておきたい7つのポイント

    マイクロソフト社が技術分野でもっと熱い専攻の一つとして分析/統計をあげている(Microsoft JobsBlog)。同社以外でも統計学は、今後最も有益なスキルの一つだと考えているようだ(NYT - For Today’s Graduate, Just One Word: Statistics)。しかし、データマイニングの話も一般化しつつあって学習ノウハウなども公開されているが、経験にあわない部分が多い。統計学を初めて勉強するときに知っておいた方が良い7つのポイントをあげてみた。 1. 学習機会やテキストは山のようにあるので利用する 確率・統計の日語テキストは山のようにあり、大学のコースワークを振り返っても、理文問わずにほとんどの学部で確率・統計はあったはずだ。大学院のコースワークでは英語の文献を好む傾向があるが、上級テキストでも日語のものも少なくない。また「マンガでわかる統計学」のよ

    統計学を勉強するときに知っておきたい7つのポイント
  • 1