タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

統計に関するnabehiroのブックマーク (4)

  • 仮説検証とサンプルサイズの基礎 - クックパッド開発者ブログ

    パートナーアライアンス部 森田です。有料会員の獲得施策や、それに関わるサービス内動線の最適化を担当しています。 記事の対象 仮説検証を通じて何かを改善をしたいと思っている人 仮説検証の際に「どれくらいのデータを集めたら良いか」分からない人 はじめに 仮説検証とは「仮説を立て、それを証明するためのデータを集め、真偽を確かめること」です。今回は仮説検証を行う際の手順と、その検証に必要なサンプルサイズの考え方を説明します。サンプルサイズの話のみ関心があるかたは、前半を飛ばし「サンプルサイズの決め方」を読んでください。 目次 記事の対象 はじめに 目次 仮説検証のつくりかた 1. 仮説をたてる 2. 施策/KPIを考える 3. 仮説検証後のアクションを決める 4. 対象を決める 5. サンプルサイズを計算する サンプルサイズの決め方 答えを先に サンプルサイズを決める二つの要素 「二つの平均値」と

  • 2.3 区間推定/信頼区間

    ←前へ | もくじ | 次へ→ 母集団から標を取り出して計算した標平均は、母平均の推定値として使うことができます。しかし、それは母平均にぴったり一致しているわけではありません。あくまでも推定値です。サンプルサイズが小さければ、標平均と母平均が離れている可能性が高くなりそうですし、逆に、サンプルサイズが大きければ、標平均と母平均とが近くなるような気がします。 そこで、母平均を、ある幅を持って推定しようということを考えます。これを「区間推定」と呼びます。「標から推定すると、母平均はこの値からこの値までの間にはいるのではないか」という形で推定をおこなうのです。 区間推定の考え方 区間推定の考え方を説明していきましょう。 まずポテトの母集団の分布を考えます。この分布が「正規分布」にしたがっているとします。正規分布というのは、下の図のように平均を山の中心として左右になめらかに広がった「つり

  • ときわ台学/統計学/標本分布

    1.標分布 [1] 前ページまでの議論は集合全体についての情報を既知として,その平均や分散などの統計的な量を算出している。いわば神の目を持つことを前提としている。しかし,集合全体の情報すべてを完全に手に入れることが難しい場合や原理的に入手すること自体が不可能な場合も多い。と言うより,むしろ,統計学の存在価値はそのような場合のためにある。 一つのサンプルに対する測定を考えてみても,例えば,地球の重力定数はある実数値として,真値や有効桁数(量子論からの限界)が存在することに間違いはないだろうが,そのために必要な実験精度の向上や必要な測定回数は,おそらく永遠に人間の手には負えないだろう。現実的には有限回の測定値を加算平均するなどして,せいぜい10桁くらいの数値を算出してよしとするしかないのである。つまり,30回計測してそれらの平均をとった場合,無限個存在するであろう計測値の中からたった30個だ

  • ときわ台学/統計学/期待値,分散,標準偏差

  • 1