タグ

統計学と機械学習に関するjassmazのブックマーク (2)

  • 機械学習にとって大切なことは全部MSE(平均二乗誤差)が教えてくれた - Qiita

    概要 機械学習の回帰問題において評価関数としてよく出てくる MSE(mean squared error,平均二乗誤差) とは一体何なのか。 山登りのように、ふもとから一歩ずつふみしめながら理解をすすめていく記録となります。 (必要な数式の導出過程も省略せず記録しました) とうことで、さっそく山登り開始します 1合目:母集団・母平均 登り始める前に、準備運動。統計用語をおさらい 「日人成人男性の平均身長調査」 を題材に、考えてみる。 選挙年齢が引き下げられたので 成人=18歳以上 とすると 日人のうち 成人 に該当するのは 約1億人。 そのうち男性が約半数なので、日人成人男性は5000万人程度と考える。 母集団(ぼしゅうだん、population) 母集団とは、調査対象となる数値、属性等の源泉となる集合全体 平均身長調査で考えると、母集団とは対象者全員ということになる。 つまり母集団

    機械学習にとって大切なことは全部MSE(平均二乗誤差)が教えてくれた - Qiita
  • 統計学とは何か、そしてベイズ統計学の話 - hidekatsu-izuno 日々の記録

    細々と統計学を調べ続けているが、最近ようやく統計学というものが何なのか、おぼろげながらわかるようになってきた(なお、統計学ができるようになってきたわけではない) 統計学を知る前の自分と今の自分をくらべたとき、間違いなく違うのは統計学に対する信頼だろう。以前は、統計学は数学の一分野であり、正しい分析手法を使えば真の答えが得られるものだと思っていた。しかし、実際には統計学者ジョージ・ボックスが言ったとされる「すべての(統計)モデルは間違っている、だが中には役立つものもある)」という言葉の方が実態に近い。 統計学は基的に「不可能なことを可能にする(不良設定問題を扱う)」学問だ。例えば、1、3、5 という数字の列から何が言えるだろうか。確実なことは3つの実数値が観測された、ということだけで、それ以上のことは想像するしかない。奇数列かもしれないし、乱数から3つの値を取得した際に偶然それっぽい数字が

    統計学とは何か、そしてベイズ統計学の話 - hidekatsu-izuno 日々の記録
  • 1