エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ゼロが多いカウントデータに対するモデリング - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
ゼロが多いカウントデータに対するモデリング - Qiita
はじめに こんにちは,株式会社Nospareの小林です.本記事ではカウントデータ分析でよく直面するゼロが... はじめに こんにちは,株式会社Nospareの小林です.本記事ではカウントデータ分析でよく直面するゼロが多いに対して,どのような統計モデルで対処できるかについて解説します. まずカウントデータですが,これはある疾病からの死亡者数,ある地点・地域における交通事故の数,個人が救急車を利用した回数などといったようにあるイベントが起こった回数に関するデータで,通常非負の整数値を取ります.例えば救急車の例でいうと多くの人は救急車を利用するという事態に直面するということは珍しいことだと考えられます.そういった場合,データはゼロ(救急車を全く利用しなかった)の値が多く含まれることになります.例えば,下図は同じサンプルサイズ($n=1000$)でほぼ同じ平均(左:2.0,右1.94)を持つ2つのカウントデータのヒストグラムになります.両方ともゼロの度数が大きいのですが,右図のほうがサンプルサイズに対するゼ