« 読了:Lewis-Beck, & Skalaban (1990) R二乗について率直に語ろう | メイン | 読了:Reyes, Francisco-Fernandez, & Cao (2016) ヒストグラムから元の確率密度を推定します、階級の幅が不均等でも大丈夫です » 2018年10月13日 (土) King, G. (1990) Stochastic variation: A comment on Lewis-Beck and Slakaban's "The R-Square". Political Analysis 2(1), 185-200. 先に読んだLewis-Beck & Skalaban (1990) に対する、政治学者King先生の反論というかコメントがあったので(というか「いつか読む」箱に入っていたので)。ついでに目を通した。ほんとはそれどころじゃないんだけど、
« 読了:Boone & Boone (2012) リッカート型項目とリッカート尺度 | メイン | 読了:King (1990) R二乗? だから要らないってば、そんなの » 2018年10月13日 (土) 都合によりcitizen forecastingについて調べていて(そういう話題があるのです)、主要研究者のひとりである政治学者M. Lewis-Beckを辿っていたら、この先生による全く別の方面の論文が「いずれ読む」箱に叩き込まれていたことに気が付いた。世界は狭い。 というわけで、整理の都合で読んでしまった。面白かったけど、別にいま読むこたあなかったな... Lewis-Beck, M.S, & Skalaban, A. (1990) The R-Squared: Some Straight Talk. Political Analysis, 2, 153-171. いわく。 政治
プール解析(プールかいせき、英: pool analysis)とは、複数の研究の元データを集めて再解析する方法である。プール解析は、広義のメタ解析に含まれるが、狭義ではメタ解析とプール解析は分けて考えられる。 例えば、薬剤の効果を300症例での検討した成績と500症例で検討した成績があるとする。使用した薬剤が同じ、更に薬物を投与した期間もほぼ同じであれば、その試験の元データを合算して一つの試験の様にした再解析が可能である。この様にプール解析では、元データを合算(300症例+500症例=800症例)し再解析する方法である。症例数が増えたデータを再解析により、検出力が上がり、より信頼度の高い結果が得られる。 なお、メタ解析(狭義)は、各試験の解析結果の集計、即ち得られた各試験で得られたイベントの発生頻度(オッズ比:Odds ratio)の集計である。 メタ解析は試験成績(Odds ratio)
« 覚え書き:スキャン・パネル・データの分析事例 | メイン | 読了:萩生田・繁桝(1996) 順序カテゴリカルデータを因子分析したときの推定値の挙動 » 2018年9月28日 (金) Wilcoxon-Mann-Whitney検定ってのがありますわね。おさらいしておくと、えーっっっとですね、いわゆる「対応のないt検定」のノンパラ版だって習った気がします。 群Aと群Bがあるとき(サイズを$n_A, n_B$とする)、群間でのすべての測定値ペア($n_A \times n_B$個)について、Aの値のほうが大きいペア数$U$を数える。群間にぜんぜん差がなければ、$U$の期待値は(タイになるペアがないとして)$n_A \times n_B / 2$である。というわけで、帰無仮説の下での$U$の分布をどうにかして求めて検定する。$n_A$+$n_B$個の測定値を順位に変換し、群Aの測定値の順位の
分散安定化変換は、確率変数 $Y$ の期待値が $\mu$ で分散が $g(\mu)$、つまり $Y$ の分散が期待値の関数であるとし、$h(Y)$ の分散 $\mathrm{Var}\{h(Y)\}$ が漸近的に一定の値になるような変換 $h$ を考える方法です。 分散安定化変換 デルタ法を用いると、$h(Y)$ の分散は \[ \mathrm{Var}\{h(Y)\}\simeq\left\{h^{\prime}(\mu)\right\}^2\mathrm{Var}\{Y\} \] で近似でき、$\mathrm{Var}\{Y\}=g(\mu)$ だから、 \[ \mathrm{Var}\{h(Y)\}\simeq (h^{\prime}(\mu))^2 g(\mu) \] となる。 さらに、上で求めた近似分散 $\mathrm{Var}\{h(Y)\}$ が一定の値になるような変換
はじめに マーケティング施策を行うときに、その施策効果を測定するために、コントロールグループ(施策を適用しないユーザ)を作る場合がある。 例えば、販促メールを送るという施策を行うときに、一部のユーザには送らないようにする。 仮にメールを送らなかったユーザの平均売上が1000円であり、メールを送ったユーザは平均1100円だとすると、その差である100円が1人あたりの施策効果となる。 しかし、施策を適用しないユーザの数を増やすと、全体の売上効果はそれだけ減少してしまう。 つまり、全体のユーザ数を1万人とすると、全員にメールを送れば100万円の売上効果があるが、半分の5千人をコントロールとすると売上効果も半分の50万円となる。 したがって、コントロールグループに割り当てる人数はなるべく小さくしたいという要求がある。 ただし、コントロールグループの人数を少なくすると、効果測定の精度が落ちるという問
318 化学と生物 Vol. 51, No. 5, 2013 セミナー室 研究者のためのわかりやすい統計学-1 統計検定を理解せずに使っている人のために I 池田郁男 東北大学大学院農学研究科 319 化学と生物 Vol. 51, No. 5, 2013 1 1 320 化学と生物 Vol. 51, No. 5, 2013 2 μ σ σ 3 * 2 3 * 321 化学と生物 Vol. 51, No. 5, 2013 4 * 5 * 6 σ 4 5 6 σ * * 322 化学と生物 Vol. 51, No. 5, 2013 μ μ μ μ μ σ 7 σ σ σ σ σ σ σ σ σ σ 8 8 9 7 σ 323 化学と生物 Vol. 51, No. 5, 2013 9 10 11 * σ σ * * * * 10 11 * * * * 324 化学と生物 Vol. 51, No.
408 化学と生物 Vol. 51, No. 6, 2013 15 μ σ μ σ μ σ 16 セミナー室 研究者のためのわかりやすい統計学-2 統計検定を理解せずに使っている人のために II 池田郁男 東北大学大学院農学研究科 15 16 409 化学と生物 Vol. 51, No. 6, 2013 μ σ σ σ μ σ * 17 μ σ μ σ * μ μ μ Z n 1 1 = − ( ) X µ σ σ 18 μ σ σ σ σ σ μ σ μ μ μ σ / n σ / n σ / n σ / n * * 17 18 σ 410 化学と生物 Vol. 51, No. 6, 2013 t u n 1 1 = − ( ) X µ σ σ σ σ σ μ t X 1 1 = − ( ) µ SE 19 μ μ μ μ μ 20 μ σ μ μ σ μ μ u n / 19 20 4
The Annals of Statistics 2002, Vol. 30, No. 5, 1225–1310 WHAT IS A STATISTICAL MODEL?1 BY PETER MCCULLAGH University of Chicago This paper addresses two closely related questions, “What is a statistical model?” and “What is a parameter?” The notions that a model must “make sense,” and that a parameter must “have a well-defined meaning” are deeply ingrained in applied statistical work, reasonably w
こんにちは。林岳彦です。ggplot2を使いこなすシャレオツな若い人を見ると自分の老いを感じる今日このごろです。 さて。 今回は、「説明変数と誤差項に相関がある」とはどういうことか、について見ていきたいと思います。 経済学系の統計解析の本を読んでいると「内生性」という概念がよく出てきます(経済学系でない分野においては、「交絡」と呼ばれるものに実務上はおおむね対応する概念と言えます)。 この「内生性」の説明としては、例えば: 計量経済モデルにおいて、説明変数と誤差項との間に相関があるときに、内生性(endogeneity)があるという。このとき、説明変数は内生的(endogenous)であることになる。説明変数が内生的であれば、推定されたパラメータは一致推定量ではなくなり、推定値は統計学的に信頼されるものとはなりえない。 のように説明されます(内生性 - Wikipediaより引用*1。強調
東京大学 COE ものづくり経営研究センター MMRC Discussion Paper No. 183 MMRC DISCUSSION PAPER SERIES MMRC-J-183 消費者行動理論にもとづいた 個人レベルの RF 分析: 階層ベイズによる Pareto/NBD モデルの改良 東京大学 大学院経済学研究科・経済学部 阿部 誠 2007 年 11 月 東京大学 COE ものづくり経営研究センター MMRC Discussion Paper No. 183 1 消費者行動理論にもとづいた個人レベルの RF 分析: 階層ベイズによる Pareto/NBD モデルの改良 東京大学 大学院経済学研究科・経済学部 阿部 誠 2007 年 11 月 阿部 誠 2 An Individual Level RF Analysis based on Consumer Behavior The
« 読了:Zenobia, Weber, & Daim (2009) エージェント・ベース・シミュレーションによる技術イノベーション研究レビュー | メイン | 読了:北條(2001) 子どもの学力のモデルを2SLSで推定 » 2014年11月27日 (木) 巷には殺伐とした話が溢れているが、マーケティング分野における「殺伐とした用語」ナンバーワン、それは「顧客生涯価値」だと思う。こないだスタバでおっさんが若者に「マーケティングは愛だ」と熱く語っていて閉口したが、ああいう人に一度訊いてみたいものだ、顧客にとってのサービスや製品の価値ではなく、「企業にとっての顧客の価値」を問う人の、どこにどのような愛があるというのか、と... Jain, D. & Singh, S.S. (2002) Consumer lifetime value research: A review and future
Rを用いたLTV(Life Time Value)の推定1. 1 4. 5. ü ü 6. LTV LTV LTV 7. 8. 1. 2. 1 3. 4. 9. A B C 0.9 0.7 0.4 2.0 2 10. P | 12. 1. λ 2. µ 3. λ 4. µ 3 5. Λ µ 5 13. 0 Tt X × τ 14. 0 Tt X × τ 15. 0 Tt X × τ 16. 0 Tt X × τ 17. 0 Tt X × τ 18. 0 Tt X × τ 19. 0 Tt X × τ λ, µ 20. 0 Tt X × τ r, s, α, β 21. 0 Tt X × τ T 22. 24. ID 1 19970101 2 29.33 1 19970118 2 29.73 1 19970802 1 14.96 1 19971212 2 26.48 2 19970
とあるところで因子分析の情報量規準について見て、少し思うことがあったので簡単にまとめた。 因子分析のモデルは一般的には特異モデルであるため、BICの仮定が成立していない可能性がある。 (因子分析におけるBICの妥当性については後で述べるとして…)こういった場合、特異モデルの情報量規準として WBIC (Watanabe, 2013) sBIC (Drton & Plummer, 2017) を使うことを検討することになるであろう。 因子分析に用いる場合、この2つでどちらの方が良さそうだろうか? この2つの比較であれば以下の観点でsBICに軍配が上がると思われる。 対数周辺尤度の漸近展開の主要2項からのバイアス 因子分析であれば実対数閾値の理論値が知られている。したがってsBICの方が対数周辺尤度の漸近展開の主要2項はよく近似されると期待される。一方で、WBICはサンプルサイズが小さいときに
信頼区間 (Confidence interval)は、統計学を習う際、最初の方に出てくる概念ですが、名前もあってその解釈にはしばしば誤解が生じます。直感的な解釈はベイズ統計学を用いた確信区間 (Credible interval)の方がふさわしいのですが、その違いがわからない、そもそも確信区間とか知らない、という人も多いのではないでしょうか。 この記事では、統計学を2分する頻度論者 (Frequentist) とベイジアン (Bayesian) の立場を今一度明らかにし、信頼区間と確信区間の違いを理解し、データの統計学的解析に役立てたいと思います。 正しい信頼区間 (Confidence interval) の考え方 データのバラツキを表現する方法は、分散 (Variance)、標準偏差 (Standard deviation)など様々あり、信頼区間 (Confidence interv
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く