タグ

statisticsに関するromans12のブックマーク (2)

  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • エラーバーについて教えて下さい。 - OKWAVE

    こんばんは。おっさんです。 標準偏差をσと書くことにします。 >>>調べたところ95%信頼区間 95%信頼区間は、正規分布で言えば、±2σ です。 >>>これはどうやって使い分ければ良いのでしょうか? >>>また一般的にもっともよく使われるものについて教えて下さい。 私の経験上、 ・工業で製品や部品の特性値を集計するときは、通常、±3σ を用います。 (たまに、±2σ や ±6σ を使っているケースも目にしますが) ・学問の世界では、±σ が最も多く使われているはずです。 σを2倍、3倍・・・してみたところで、学問としては、あまり意味がないですから。 ±σ から はみ出すものは32%もありますから、工業では実用性があまりありません。 ・標準誤差は、サンプル数や計測時間が異なるデータ同士を付き合わせる場合にのみ使います。 たとえば、 1分当り400個の放射線を出す放射性物質があるとして、 1

    エラーバーについて教えて下さい。 - OKWAVE
    romans12
    romans12 2011/04/27
    工業で製品や部品の特性値を集計するときは、通常、±3σ。学問の世界では、±σ
  • 1