タグ

統計学に関するsso775のブックマーク (16)

  • 偏差値とは?母集団、平均、正規分布からわかりやすく説明します - おまきざるの自由研究

    はじめに 偏差値のおおもとは平均値 偏差値の計算には平均値と標準偏差が欠かせない 偏差値とはなんぞや? 標準化得点とは 偏差値とは 実際のデータを使って偏差値を計算してみよう 偏差値を作った男 おわりに:こんなときは注意しよう 標準偏差の求め方の参考HPと書籍 その他の参考HP等 はじめに 大学受験,高校受験,あるいは中学受験のとき,偏差値という言葉を聞いたことがない日人はいないと思います. 中には偏差値で人生が変わった人も少なからずいることでしょう. うちの子たちの受験でも『進学レーダー』に添付されてる各校偏差値一覧を何度も何度も何度も何度も目にしました. でも受験が終わってふと我に返るとその偏差値はいったいどんな計算をしてはじきだされるのか私は説明できませんでした. 筆者は統計検定について仕事の都合で否応なくそれなりに勉強しましたが,偏差値はスルーしていたのです. そこで,このエント

    偏差値とは?母集団、平均、正規分布からわかりやすく説明します - おまきざるの自由研究
  • 【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート

    主なデータの代表値に、平均値、中央値、最頻値の3つがあります。どれも、データ全体の特徴を表すものですが、どうして代表値が3つもあるのでしょうか。「1個なら覚えるのも楽なのに!」と言いたい人もいるでしょう。また、結局どれを使えばいいのかわからないという人もいるかもしれません。 ここではそういった疑問について考えていきます。3つの代表値のメリット・デメリットや、使い分けについて考えていきます。 各代表値の得意・不得意 代表値とは、データ全体の特徴を表した値のことです。平均値は、「すべての数値を足して、数値の個数で割ったもの」、中央値は、「数値を小さい方から並べたときに、真ん中に来るもの」、最頻値は、「一番個数が多いもの」です。どれも「データを特徴づける値」ですが、それぞれの代表値には、得意・不得意があります。 データが次のようにきれいな左右対称の山の形に分布していた場合は、平均値も中央値も最頻

    【基本】平均値・中央値・最頻値はどう使い分ける? | なかけんの数学ノート
  • ベイズ推論:いつも何度でも尋ねられること

    このページをご覧頂き、ありがとうございます。 「ベイズと最尤のどちらが正しいのか」と、いつも何度でも尋ねられます。 「事前分布は何が正しいのか」と、いつも何度でも尋ねられます。 ここでは、できるだけ短く、その質問についての返答を述べます。 1.正しい統計的推論は存在しない 統計学が扱う問題では、ほとんどの場合、基礎となる確率がわからないので、 特別な場合を除いて、正しいモデル・正しい事前分布・正しい推論というものは存在しません。 条件が不足したり過剰だったりして答えられない問題のことを【不良設定問題】と いいます。 統計学は不良設定問題を扱う学問です。 この世にあるほとんどの問題は程度の違いこそあれ、みな不良設定です。 まずは「統計学は不良設定問題を扱う学問である」ということを理解しましょう。 基礎となる確率が定められていなければ【正しい統計的推論】は存在しません。 (注) 基礎となる確率

    ベイズ推論:いつも何度でも尋ねられること
  • 行列計算を利用したデータ解析技術

    2017年2月17日に行われた統計数理研究所での研究集会『因果推論の基礎』での講演内容です(配布用の改変あり)。スライドだけだと口頭での説明がないので分かりにくい部分もあるかもしれません。 [http://www.ism.ac.jp/events/2017/meeting0216_17.html:title]

    行列計算を利用したデータ解析技術
  • カップルが一緒にお風呂に入る割合をベイズ推定してみた

    [DL輪読会]Scalable Training of Inference Networks for Gaussian-Process ModelsDeep Learning JP

    カップルが一緒にお風呂に入る割合をベイズ推定してみた
  • なぜ統計学がビジネスの 意思決定において大事なのか?

    ※ブラウザでうまく表示されませんのでDLして御覧ください※ ※以下のリンクからもご覧いただけます※ https://speakerdeck.com/tam07pb915/nagoyar15 ロジスティック回帰や多項ロジスティック回帰などの一般化線形モデルを用いた分析の結果を図示するためのeffectsパッケージの紹介をします。

    なぜ統計学がビジネスの 意思決定において大事なのか?
  • 『ダメな統計学』冊子PDFの公開|Colorless Green Ideas

    『ダメな統計学』表紙 現在の科学研究において統計が誤用されていることが非常に多く、そのために科学研究の信頼性が揺らいでいることを記した『ダメな統計学』の冊子PDFを公開する。これは、アレックス・ラインハート氏が書いたStatistics Done Wrongの全訳である。理解を深めるために、訳注を比較的豊富に加えた。 2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』の冊子PDFに比べると、大幅に加筆されている。ページ数で言うと2倍以上になっている。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 『ダメな統計学

    『ダメな統計学』冊子PDFの公開|Colorless Green Ideas
  • 不偏分散はなぜ n – 1 で割るのか?

    鈴木です。技術ネタではなく異色のマニアックなネタです。 社内では統計の勉強会を毎週行っております。 その中で、普通の分散は\( n \)で割るのに、 不偏分散はなぜ\( n – 1 \)で割るのか、という疑問がわいたのですが、 社内では誰も納得できる答えを持ち合わせておりませんでした。 文献によっては「自由度」という概念で説明されていたのですが、 単に言葉で誤魔化しただけのような気がして、 自分で納得できる答えを探し求めた結果をここに残しておきます。 不偏分散とは 日人全体の身長の平均と分散を求めることを考えてみます。 分散というのは、平均からどの程度散らばっているかを示す数値です。 例えば、120cm、140cm、160cmの3人は、138cm、140cm、142cmの3人よりも分散が大きくなります。 日人全員の身長の分散といった場合は、身長の平均を求めて、 各人の身長から平均を引い

    不偏分散はなぜ n – 1 で割るのか?
  • 不偏分散はなぜ n - 1 で割るのか? | hydroculのメモ

    不偏分散はなぜ n - 1 で割るのか? 2014/02/08 分散というのは、平均からの散らばり具合を示す統計です。分散を計算するときに \(n\) で割るところがあるのですが、 \(n-1\) で割らないといけない場合があり、なぜ \(-1\) なのか?という問題です。 疑問の概要 日人全員の身長の分散といった場合は、身長の平均を求めて、各人の身長から平均を引いた数の二乗を日人全員で合計したものを、人口で割ったものです。 しかし日人全員の身長をいっせいに測定するのは難しいので、一部の人たちだけの身長を測定して、そこから日人全体の平均と分散を推測したい、という場合がよくあります。 この、「一部の人たち」を標と言い、日人全体を母集団と言います。 母集団の平均を推測するには、単に標の平均を計算します。標の平均がだいたい母集団の平均になる、というのは、なんとなくそんな気がします

  • プログラミングのための確率統計 in Haskell

    こんな表のことを確率分布といいます。サイコロをふったときに起こるイベントの確率、たとえば「偶数の目が出る」確率を調べることは、この確率分布からこんな別の確率分布への変換だと考えられます。 この変換は、具体的にはこんな対応です。P(偶数) = P(2) + P(4) + P(6) P(奇数) = P(1) + P(3) + P(5)P(X)がイベントXに対する確率を表しているわけですが、Pを「イベントの集合から[0,1]区間の実数への関数」だとみなすこともできます。確率分布から確率分布への変換は、関数に対する演算でもあるわけです。確率分布を連想リストで表せば、高階関数や代数型を使って、この変換をモデル化できそうです。 以前、このアイデアをSchemeで試してみたことがありました。当時は、そもそも確率についての理解が今よりもいっそうあやしかったし、実装もちゃちでしたが、このアイデアが特別なもの

  • F分布

  • http://bstat.f7.ems.okayama-u.ac.jp/statedu/lispstat-book/node60.html

    sso775
    sso775 2010/12/17
    連続型確率の導入からカイ分布、t分布、F分布
  • 微分積分

    静岡理工科大学情報学部コンピュータシステム学科菅沼研究室のページです.主として,プログラミング言語( HTML,C/C++, Java, JavaScript, PHP, HTML,VB,C# ),及び,システムエンジニアとしての基礎知識(数学,オペレーションズ・リサーチやシステム工学関連の手法)を扱っています.

  • 平均・分散の推定(損保数理の問題から) - アクチュアリー試験数学の研究

    今日は、読者の方(以下「Aさん」と表記します。)からのいただいた損保数理の問題(平成17年度の損保数理の問題1の(5))に関連し、 平均・分散の推定 というテーマで考えてみます。 問題は次のとおりです。(過去問題集からの引用) ある保険のポートフォリオが、次のとおり与えられているものとする。 (i)*1被保険者のクレーム件数はポアソン分布に従う。 (ii)被保険者ごとに被保険者のクレーム件数の平均は異なる値をとる。 (iii)1,000人の被保険者を無作為に抽出したところ、各被保険者ごと*2のクレーム件数は下表のとおりであった。 クレーム件数 0 1 2 3 4 5 計 被保険者数 512 307 123 41 11 6 1,000 (iv)クレーム額の平均は1,500、分散は6,750,000である。 (v)クレーム額とクレーム件数は、互いに独立である。 (vi)95%の確率でクレーム総

    平均・分散の推定(損保数理の問題から) - アクチュアリー試験数学の研究
    sso775
    sso775 2010/11/25
    モーメント法による推定
  • モーメント法による推定量: Minkyのよもやま日記

    sso775
    sso775 2010/11/25
    ベイズ統計量におけるパラメータの推定
  • 最尤法

    最尤法     Last modified: May 16, 2002 一致性,有効性,十分性を満たす最適推定量は,最尤法 により求めることができる。 母数が $\theta$ である母集団 $f ( \mathbf{x}\ |\ \theta )$ から,$n$ 個の標 $X_{1}, X_{2}, \dots , X_{n}$ が抽出されたとする。 このとき,確率密度は(1)式で表せる。 \[ f(X_1 \ |\ \theta)\ f(X_2 \ |\ \theta)\ \cdots\ f(X_n \ |\ \theta) \tag{1} \] 今までは,母数 $\theta$ を持つ母集団から抽出された一つの確率変数 $\mathbf{x}$ が $X$ という実現値をとるとして,$f ( \mathbf{x}\ |\ \theta )$ を $\mathbf{x}$ の関数と見

    sso775
    sso775 2010/11/24
    最尤法 フィッシャーの定義した尤度関数 例題
  • 1