タグ

ブックマーク / rikunora.hatenablog.com (3)

  • なぜ統計学では釣り鐘型の分布が使われ、物理現象では右肩下がりの分布が使われるのか - 小人さんの妄想

    「なぜ統計学では釣り鐘型の分布が使われ、物理現象では右肩下がりの分布が使われるのでしょうか」 という疑問を、統計学や物理学の有識者に会うたびごとに質問するが、こんな基的なことに誰も答えられない -- データの見えざる手 [矢野和夫](思想社) P.32 より. 釣り鐘型の分布とは、正規分布(ガウス分布)のこと。 右肩下がりの分布とは、指数分布(ボルツマン分布、上の書籍内では「U分布」)のことです。 ここに2つのグラフがあります。 1つは全国17歳学童の身長の分布、もう1つは二人以上の世帯の貯蓄額の分布です。 見ての通り、身長は釣り鐘型の正規分布で、貯蓄額は右肩下がりの指数分布です(近似的には)。 * 学校保健統計調査 平成27年度 全国表 > 身長の年齢別分布 >> http://www.e-stat.go.jp/SG1/estat/List.do?bid=000001070659&cy

    なぜ統計学では釣り鐘型の分布が使われ、物理現象では右肩下がりの分布が使われるのか - 小人さんの妄想
  • なぜ分散は2乗の和なのか - 小人さんの妄想

    Q.なぜ分散は、単純な差(偏差の絶対値)ではなく、差の2乗を計算するのか? A.分散を最も小さくする点が平均値だから。(単純な差を最も小さくする点は中央値となる。) “分散”というキーワードは統計学の基礎中の基礎であり、どんな教科書にも“平均”の次くらいに載っていることがらです。 しかしながら、いきなり登場する“分散”の意味が分からず、統計学の入り口で挫折する人は少なくありません。 偏差の2乗の平均、つまり、各値と平均との差の2乗の平均を分散といい、 分散の平方根の正の方を標準偏差という。 統計で、ちらばりを表すものとして、標準偏差や分散が多く用いられる。 -- 高校の教科書(啓林館)より. 教科書にはこのように書かれているのですが、これで分かった気になるでしょうか。 ・なぜ、差の2乗を計算するのか? ・差そのものであってはいけないのか? ・なぜ、分散と標準偏差の2種類があるのか? 最後の

    なぜ分散は2乗の和なのか - 小人さんの妄想
  • Amazonに見る小さなビッグデータ - 小人さんの妄想

    Amazonサイト上で、1冊のランキングを追跡すれば、書店全体の売上傾向がわかる。 そんなことを数理的に詳しく調べた研究があります。 Amazonランキングの謎を解く: 確率的な順位付けが教える売上の構造 (DOJIN選書) 作者: 服部哲弥出版社/メーカー: 化学同人発売日: 2011/05/30メディア: 単行購入: 4人 クリック: 551回この商品を含むブログ (26件) を見る 著者である服部哲弥先生の解説ページはこちら。 この"ランキング"の帰結によると、Amazonは実はロングテールビジネスではない、とのことです。 一方、Wikipedia の「ロングテール」の項目には 「代表的なオンライン小売店の1つである「Amazon.com」(アマゾン社)を例に説明する。」 と記されているくらいですから、これはかなり意外な結果ではないでしょうか。>> wikipedia:ロング

    Amazonに見る小さなビッグデータ - 小人さんの妄想
  • 1