タグ

統計量に関するyuisekiのブックマーク (6)

  • 十分統計量が少しわかった気がするのでメモ

    PRML読んでて出て来たけど、詳しく説明されてない(気がする)ので分からなかった。ベイズのあたりも分からないので、現実逃避(笑)のために調べてみた。当たり前すぎる事ばかりで晒すのが恥ずかしい気もするw 十分統計量について分かった事: (パラメトリックな)確率分布を仮定している。 その分布の確率変数のみを引数にとる関数である。 この関数さえ分かれば、確率分布を再構成出来る。 十分統計量「確率変数のみを引数にとる関数」であれば何でも良い(例えば定数倍もOK)。名前から何か不変量かと思っていたけど、ようするに関数なんだなこれは。 求めた十分統計量から確率分布のパラメタへの変換があれば、以下の順番で確率分布を再構成出来る。 サンプルから十分統計量を求める。 さっきの言い方と少し矛盾。十分統計量はサンプルを引数にとる関数なので。サンプルに対する十分統計量とでも言うべき? パラメタを求める。(普通はパ

    十分統計量が少しわかった気がするのでメモ
  • 指数関数族、十分統計量 - ryamadaの遺伝学・遺伝統計学メモ

    共役事前分布なるものが存在し、それによって、事前確率→事後確率→事前確率→事後確率→・・・というプロセスを単純に取り扱うことができることを示した。この事前確率・事後確率はベイズの考え方であるが、このベイズの考え方が、ベータ関数・ディリクレ関数に代表される関数群で有用であるということを意味する。このベイズの考え方で有用であるという性格は、これらの関数が指数関数族と呼ばれる関数タイプに属し、それらの式の形が、十分統計量という考え方と合致していることをこの記事では記す。 多変量ベクトルがある。同じ次元の多変量ベクトルがある。確率がであるような事象で、なる観測度数が得られる確率を考える。を条件として、はとの関数として表され、その式表現が指数関数を用いて、次のように書けるとき、その関数を指数関数族に属すると言う。 についての非減少関数が存在し、そのについての増分が指数関数を用いて、次のように表せるよ

  • Sufficient statistic - Wikipedia

    In statistics, sufficiency is a property of a statistic computed on a sample dataset in relation to a parametric model of the dataset. A sufficient statistic contains all of the information that the dataset provides about the model parameters. It is closely related to the concepts of an ancillary statistic which contains no information about the model parameters, and of a complete statistic which

  • 十分統計量 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "十分統計量" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2015年9月) 十分統計量(じゅうぶんとうけいりょう)とは、十分性を持つ統計量を指す。統計量が十分性を持つ、また十分であるとは、その統計量が下記の性質を満たすことを指す。 ある統計データに対し、それが従う確率分布を示す母数 θ に対応するその統計量の値が決められた条件下で、データが出現する条件付き確率分布が、もはやθ にはよらない。 直感的にいうと、「母数θ(直接は求められず、推定しかできない)に対する十分統計量は、θ の統計学的推定に関する限り、データから得られる情報を漏らさ

  • 統計量 - Wikipedia

    統計量(とうけいりょう)とは、統計学において、一組の標データに、目的に応じた統計学的なアルゴリズム(関数)を適用し得た、データの特徴を要約した数値を指す。なお十分性をもつ統計量を十分統計量と呼ぶ。日産業規格では「確率変数だけで規定された関数」[1]と定義している。 例えば簡単な統計量の一例として算術平均を計算する際には、全てのデータ数値を合計しデータ数値の数で割るというアルゴリズムを用いる。 統計学的には、対象とするデータは母集団から抽出される標であり、標から直接算出される統計量は観測(観察)できるランダム変数の一種であり、標の性質を表現する数値である。普通は母集団を母数(観測できない)によって特徴づけられる確率分布として仮定し、そこからあるサイズの標をランダムに抽出するものとする。 母数の値、例えば全国の25歳の男性の身長の平均は観測できないが、それに対応する統計量、例えば1

  • 十分統計量(sufficient statistics) - EchizenBlog-Zwei

    最尤推定やEMアルゴリズムでは十分統計量(sufficient statistics)という概念が出てくる。特にEMアルゴリズムを実装する場合には十分統計量という考えを知っておいた方が良い。というわけで十分統計量についてメモしておく。 例えば入力データの平均値を計算する場合、perlで以下のように書ける。 my @a; while (<>) { push(@a, int($_)); } my $s = 0; foreach (@a) { $s += $_; } print $s / @a;このコードは非効率な点がある。何故なら平均値を計算するには入力データの合計値があれば十分なので、入力データが与えられる度に$sに値を足し込んでいけばよく、一度全データを配列@aに持たせる必要はない。つまり my $s = 0; my $z = 0; while (<>) { $s += int($_);

    十分統計量(sufficient statistics) - EchizenBlog-Zwei
  • 1