ある実験(実験1 とします)でn 個のデータ x1, x2, …, xn を集めたとします。 するとその n 個のデータから平均値 m1 と標準偏差 sd1 が得られます(実験1 のデータから計算したという意味で添字 1 を付けます)。 さて、通常は n 個のデータを集めて実験は終了し、データの分析となるわけですが、仮に同じ実験をもっと繰り返したと“想像”してみましょう。それらを実験2、実験3、…とします。そうすると通常は実験で得られる測定値というのは様々な誤差を伴いますので、条件を同じにしたとしてもそれぞれの実験で得られる n 個のデータは毎回同じ組み合わせにはならず、従ってそれぞれの実験データから得られる平均値と標準偏差も異なったものになります(これが X が確率変数と呼ばれる所以です)。 実験を z 回繰り返したとすれば、対応して z 個の平均値 m1, m2, …, mz と z
こんばんは。おっさんです。 標準偏差をσと書くことにします。 >>>調べたところ95%信頼区間 95%信頼区間は、正規分布で言えば、±2σ です。 >>>これはどうやって使い分ければ良いのでしょうか? >>>また一般的にもっともよく使われるものについて教えて下さい。 私の経験上、 ・工業で製品や部品の特性値を集計するときは、通常、±3σ を用います。 (たまに、±2σ や ±6σ を使っているケースも目にしますが) ・学問の世界では、±σ が最も多く使われているはずです。 σを2倍、3倍・・・してみたところで、学問としては、あまり意味がないですから。 ±σ から はみ出すものは32%もありますから、工業では実用性があまりありません。 ・標準誤差は、サンプル数や計測時間が異なるデータ同士を付き合わせる場合にのみ使います。 たとえば、 1分当り400個の放射線を出す放射性物質があるとして、 1
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く