タグ

統計に関するakiramazのブックマーク (4)

  • えるエル on Twitter: "東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販の本を買うよりは,この3… https://t.co/w2cSVIxmUI"

    東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販のを買うよりは,この3… https://t.co/w2cSVIxmUI

    えるエル on Twitter: "東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販の本を買うよりは,この3… https://t.co/w2cSVIxmUI"
  • サンプリング数の決定における許容誤差について

    No.1様のご回答とかぶりますが、「サンプル数」というのはよく間違える使い方なんですよね。 サンプル(標ともいいます)とは、母集団(この場合であれば、日国民全員)から選ばれた人の集まりのことです。 標として選ばれた人の数を標の「大きさ」(サンプルサイズ)といいます。 例えば、母集団から選ばれた人の集まり(標)が「農家だけの標」、「サラリーマンだけの標」の2つであれば、サンプル数は「2」となります。ちょっと意味合いが違うでしょ? さて、ご質問の件ですが、キーワードは参照サイトでいう「許容できる誤差の範囲」2.5%と「信頼度」95%の2つです。 サンプル平均値(調査結果)と母集団平均値(実態)が「≠」では困りますが、せめて「≒」になるためには、ある程度の回収率や回答率(以下「回収率」という。)が必要です。 統計学上意味のある回収率は計算によって求められるわけですが、その際、「許容

    サンプリング数の決定における許容誤差について
    akiramaz
    akiramaz 2016/07/24
    良い説明
  • ケーキに3回だけ刃を入れてできるだけ公平に分割したい話 - アジマティクス

    今日は楽しいパーティです。 白雪姫は、円形のケーキを作りました。 白雪姫 円形のケーキに上から1回だけ包丁を入れると、最大2分割できます。 2回包丁を入れると、最大4分割までできます。 では、3回包丁を入れると最大で何分割できるでしょうか。そのまま考えると、6分割でしょうか? 上図のように切れば、最大で7つに分割することができます。 ちなみに回包丁を入れると最大分割、回だと、回だと、そして回だと最大個のピースに分割できることがわかっています。なるべく多く線が重なるように切ればいいのです。実際にやって確かめてみたい感じありますが、しかし今回の題はそこではないのでまたこんどにしましょう。 白雪姫は、王子様からもらった大切な包丁をあまり使いたくなかったので、ケーキに3回だけ包丁を入れて7つに分割し、それを7人のこびとたちに下図のように配ることにしました。 こびとたち しかし、このような切り方で

    ケーキに3回だけ刃を入れてできるだけ公平に分割したい話 - アジマティクス
  • 職業別の生涯未婚率

    生涯未婚率という指標をご存知でしょうか。読んで字のごとく,生涯,未婚の状態にとどまる者がどれほどいるかです。 これは,全人口の人生を死ぬまで追跡して出すような,込みいったものではありません。生涯未婚率としては,50歳時点の未婚率が用いられます。この年齢以降は,結婚する者はほとんどいないであろう,という仮定に立つわけです。 なお,多くの官庁資料の年齢統計は5歳刻みのものですが,5歳刻みの統計から生涯未婚率を出す場合,40代後半と50代前半の未婚率を平均するという便法がとられます。 私は,この方式に依拠して,男女の生涯未婚率を職業別に計算してみました。こういうデータは見かけないので,興味を持った次第です。正規・非正規の影響を除くため,正規職員男女の率を出すこととします。資料は,2012年の総務省『就業構造基調査』です。 http://www.stat.go.jp/data/shugyou/2

    職業別の生涯未婚率
  • 1