[B! 統計学] sso775のブックマーク

偏差値とは？母集団、平均、正規分布からわかりやすく説明します - おまきざるの自由研究

はじめに偏差値のおおもとは平均値偏差値の計算には平均値と標準偏差が欠かせない偏差値とはなんぞや？標準化得点とは偏差値とは実際のデータを使って偏差値を計算してみよう偏差値を作った男おわりに：こんなときは注意しよう標準偏差の求め方の参考HPと書籍その他の参考HP等はじめに大学受験，高校受験，あるいは中学受験のとき，偏差値という言葉を聞いたことがない日本人はいないと思います．中には偏差値で人生が変わった人も少なからずいることでしょう．うちの子たちの受験でも『進学レーダー』に添付されてる各校偏差値一覧を何度も何度も何度も何度も目にしました．でも受験が終わってふと我に返るとその偏差値はいったいどんな計算をしてはじきだされるのか私は説明できませんでした．筆者は統計検定について仕事の都合で否応なくそれなりに勉強しましたが，偏差値はスルーしていたのです．そこで，このエント

sso775 2017/04/11

リンク

【基本】平均値・中央値・最頻値はどう使い分ける？ | なかけんの数学ノート

主なデータの代表値に、平均値、中央値、最頻値の3つがあります。どれも、データ全体の特徴を表すものですが、どうして代表値が3つもあるのでしょうか。「1個なら覚えるのも楽なのに！」と言いたい人もいるでしょう。また、結局どれを使えばいいのかわからないという人もいるかもしれません。ここではそういった疑問について考えていきます。3つの代表値のメリット・デメリットや、使い分けについて考えていきます。各代表値の得意・不得意代表値とは、データ全体の特徴を表した値のことです。平均値は、「すべての数値を足して、数値の個数で割ったもの」、中央値は、「数値を小さい方から並べたときに、真ん中に来るもの」、最頻値は、「一番個数が多いもの」です。どれも「データを特徴づける値」ですが、それぞれの代表値には、得意・不得意があります。データが次のようにきれいな左右対称の山の形に分布していた場合は、平均値も中央値も最頻

sso775 2017/01/22

リンク

ベイズ推論：いつも何度でも尋ねられること

このページをご覧頂き、ありがとうございます。「ベイズと最尤のどちらが正しいのか」と、いつも何度でも尋ねられます。「事前分布は何が正しいのか」と、いつも何度でも尋ねられます。ここでは、できるだけ短く、その質問についての返答を述べます。１．正しい統計的推論は存在しない統計学が扱う問題では、ほとんどの場合、基礎となる確率がわからないので、特別な場合を除いて、正しいモデル・正しい事前分布・正しい推論というものは存在しません。条件が不足したり過剰だったりして答えられない問題のことを【不良設定問題】といいます。統計学は不良設定問題を扱う学問です。この世にあるほとんどの問題は程度の違いこそあれ、みな不良設定です。まずは「統計学は不良設定問題を扱う学問である」ということを理解しましょう。基礎となる確率が定められていなければ【正しい統計的推論】は存在しません。（注）基礎となる確率

$ベイズ推論：いつも何度でも尋ねられること$

sso775 2016/09/28

リンク

行列計算を利用したデータ解析技術

2017年2月17日に行われた統計数理研究所での研究集会『因果推論の基礎』での講演内容です（配布用の改変あり）。スライドだけだと口頭での説明がないので分かりにくい部分もあるかもしれません。 [http://www.ism.ac.jp/events/2017/meeting0216_17.html:title]

sso775 2015/10/11

リンク

カップルが一緒にお風呂に入る割合をベイズ推定してみた

[DL輪読会]Scala ble Training of Inference Networks for Gaussian-Process ModelsDeep Learning JP

sso775 2015/03/08

リンク

なぜ統計学がビジネスの意思決定において大事なのか？

※ブラウザでうまく表示されませんのでDLして御覧ください※ ※以下のリンクからもご覧いただけます※ https://speakerdeck.com/tam07pb915/nagoyar15 ロジスティック回帰や多項ロジスティック回帰などの一般化線形モデルを用いた分析の結果を図示するためのeffectsパッケージの紹介をします。

sso775 2015/02/14

リンク

『ダメな統計学』冊子PDFの公開｜Colorless Green Ideas

『ダメな統計学』表紙現在の科学研究において統計が誤用されていることが非常に多く、そのために科学研究の信頼性が揺らいでいることを記した『ダメな統計学』の冊子PDFを公開する。これは、アレックス・ラインハート氏が書いたStatistics Done Wrongの全訳である。理解を深めるために、訳注を比較的豊富に加えた。 2017年1月20日追記：『ダメな統計学――悲惨なほど完全なる手引書』という本が出版されることになった。この本は、ここに掲載されているウェブ版の『ダメな統計学』の冊子PDFに比べると、大幅に加筆されている。ページ数で言うと2倍以上になっている。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。『ダメな統計学

sso775 2014/12/29

統計学

リンク

不偏分散はなぜ n – 1 で割るのか？

鈴木です。技術ネタではなく異色のマニアックなネタです。社内では統計の勉強会を毎週行っております。その中で、普通の分散は$ n $で割るのに、不偏分散はなぜ$ n – 1 $で割るのか、という疑問がわいたのですが、社内では誰も納得できる答えを持ち合わせておりませんでした。文献によっては「自由度」という概念で説明されていたのですが、単に言葉で誤魔化しただけのような気がして、自分で納得できる答えを探し求めた結果をここに残しておきます。不偏分散とは日本人全体の身長の平均と分散を求めることを考えてみます。分散というのは、平均からどの程度散らばっているかを示す数値です。例えば、120cm、140cm、160cmの3人は、138cm、140cm、142cmの3人よりも分散が大きくなります。日本人全員の身長の分散といった場合は、身長の平均を求めて、各人の身長から平均を引い

sso775 2014/10/02

リンク

不偏分散はなぜ n - 1 で割るのか？ | hydroculのメモ

不偏分散はなぜ n - 1 で割るのか？ 2014/02/08 分散というのは、平均からの散らばり具合を示す統計です。分散を計算するときに $n$ で割るところがあるのですが、 $n-1$ で割らないといけない場合があり、なぜ $-1$ なのか？という問題です。疑問の概要日本人全員の身長の分散といった場合は、身長の平均を求めて、各人の身長から平均を引いた数の二乗を日本人全員で合計したものを、人口で割ったものです。しかし日本人全員の身長をいっせいに測定するのは難しいので、一部の人たちだけの身長を測定して、そこから日本人全体の平均と分散を推測したい、という場合がよくあります。この、「一部の人たち」を標本と言い、日本人全体を母集団と言います。母集団の平均を推測するには、単に標本の平均を計算します。標本の平均がだいたい母集団の平均になる、というのは、なんとなくそんな気がします

sso775 2014/10/02

リンク

プログラミングのための確率統計 in Haskell

こんな表のことを確率分布といいます。サイコロをふったときに起こるイベントの確率、たとえば「偶数の目が出る」確率を調べることは、この確率分布からこんな別の確率分布への変換だと考えられます。この変換は、具体的にはこんな対応です。P(偶数) = P(2) + P(4) + P(6) P(奇数) = P(1) + P(3) + P(5)P(X)がイベントXに対する確率を表しているわけですが、Pを「イベントの集合から[0,1]区間の実数への関数」だとみなすこともできます。確率分布から確率分布への変換は、関数に対する演算でもあるわけです。確率分布を連想リストで表せば、高階関数や代数型を使って、この変換をモデル化できそうです。以前、このアイデアをSchemeで試してみたことがありました。当時は、そもそも確率についての理解が今よりもいっそうあやしかったし、実装もちゃちでしたが、このアイデアが特別なもの

sso775 2010/12/23

リンク

F分布

sso775 2010/12/17

リンク

http://bstat.f7.ems.okayama-u.ac.jp/statedu/lispstat-book/node60.html

sso775 2010/12/17

連続型確率の導入からカイ分布、t分布、F分布

リンク

微分積分

静岡理工科大学情報学部コンピュータシステム学科菅沼研究室のページです．主として，プログラミング言語（ HTML，C/C++, Java, JavaScript, PHP, HTML，VB，C# ），及び，システムエンジニアとしての基礎知識（数学，オペレーションズ・リサーチやシステム工学関連の手法）を扱っています．

sso775 2010/11/25

リンク

平均・分散の推定（損保数理の問題から） - アクチュアリー試験数学の研究

今日は、読者の方（以下「Ａさん」と表記します。）からのいただいた損保数理の問題（平成17年度の損保数理の問題1の(5)）に関連し、平均・分散の推定というテーマで考えてみます。問題は次のとおりです。（過去問題集からの引用）ある保険のポートフォリオが、次のとおり与えられているものとする。 (i)*1被保険者のクレーム件数はポアソン分布に従う。 (ii)被保険者ごとに被保険者のクレーム件数の平均は異なる値をとる。 (iii)1,000人の被保険者を無作為に抽出したところ、各被保険者ごと*2のクレーム件数は下表のとおりであった。クレーム件数 0 1 2 3 4 5 計被保険者数 512 307 123 41 11 6 1,000 (iv)クレーム額の平均は1,500、分散は6,750,000である。 (v)クレーム額とクレーム件数は、互いに独立である。 (vi)95％の確率でクレーム総

sso775 2010/11/25

モーメント法による推定

リンク

モーメント法による推定量: Minkyのよもやま日記

sso775 2010/11/25

ベイズ統計量におけるパラメータの推定

リンク

最尤法

最尤法　　　　　Last modified: May 16, 2002 一致性，有効性，十分性を満たす最適推定量は，最尤法により求めることができる。母数が $\theta$ である母集団 $f ( \mathbf{x}\ |\ \theta )$ から，$n$ 個の標本 $X_{1}, X_{2}, \dots , X_{n}$ が抽出されたとする。このとき，確率密度は（1）式で表せる。 \[ f(X_1 \ |\ \theta)\ f(X_2 \ |\ \theta)\ \cdots\ f(X_n \ |\ \theta) \tag{1} \] 今までは，母数 $\theta$ を持つ母集団から抽出された一つの確率変数 $\mathbf{x}$ が $X$ という実現値をとるとして，$f ( \mathbf{x}\ |\ \theta )$ を $\mathbf{x}$ の関数と見

sso775 2010/11/24

最尤法フィッシャーの定義した尤度関数例題

リンク

はてなブックマーク

タグ

関連タグで絞り込む (3)

統計学に関するsso775のブックマーク (16)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス