タグ

statisticsとmathに関するincepのブックマーク (14)

  • 平均値の多重比較とは何? わかりやすく解説 Weblio辞書

    検定手順: 前提 帰無仮説 H0:「平均値に差はない」。 対立仮説 H1:「平均値に差がある」。 有意水準 α で両側検定を行う(片側検定も定義できる)。 ライアンの方法では,名義的有意水準(α ')という概念が使われる。k 群の場合,全ての 2 群の平均値の差を検定する場合には,kC2 回の検定を行わなければならない。検定結果全体としての有意水準を α とするためには,個々の検定において有意水準を α / kC2 まで下げておけばよい。しかし,もし平均値の最大値と最小値に有意な差が認められたときには,次の段階で k - 1 個の平均値の差を検定するときには,有意水準をもう少し大きくしてもよいであろう。このように考えると,個々の検定に使用する有意水準として,次式で表される名義的有意水準を使用すればよい。 α' = 2 α / { k ( m - 1 ) } ここで,m は比較する 2 個の

  • 【例題で解説】スティール・ドゥワス検定|Staat

    スティール・ドゥワス(Steel=Dwass)検定とは スティール・ドゥワス検定はマンホイットニーのU検定を3群以上の標に対して使えるようにした方法です. 多重比較の中で最も一般的な手法である,テューキー法のノンパラメトリック版でもあり,比較方法としては全ての2群同士を代表値の差が大きいか否かで判断します. 以下の図がスティール・ドゥワス検定の考え方になります.給与に対する満足度を役職ごとに比較する例になります. 4群に対して2群の代表値の差の比較を行なう場合,検定回数は6回必要になります.有意水準α=0.05で検定を6回繰り返すと有意になる確率は26%(=1-(1-0.05)6)に上昇します(多重性の問題). 多重性の問題を解決するためにスティール・ドゥワス検定では,比較する群数が増えるごとに厳しくした限界値(分布)を用いて仮説検定を行います. スティール・ドゥワス検定は比較するグルー

  • 正規分布の基礎的な知識まとめ | 高校数学の美しい物語

    正規分布(ガウス分布)とは,図のような左右対称の連続型の確率分布です。正確な定義(確率密度関数)については後述します。 正規分布は最も代表的な分布の一つです。例えば物理などの実験における測定の誤差,テストの点数などは(ほぼ)正規分布に従う(ことが多い)と考えられています。 また,コイン投げのように,反復試行の成功回数が従う確率分布も(反復試行が多いとき,近似的に)正規分布になります。 →二項分布の正規近似(ラプラスの定理) この記事では,正規分布について,確率密度関数の式の意味や,平均・分散の導出を中心に解説します。 正規分布(ガウス分布)の確率密度関数は, f(x)=12πσexp⁡{−(x−μ)22σ2}f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left\{-\dfrac{(x-\mu)^2}{2\sigma^2}\right\}f(x)=2π​σ1​

    正規分布の基礎的な知識まとめ | 高校数学の美しい物語
  • ベンフォードの法則 - { 適用と制限 }Wikipedia

    上に示した2つの図は、対数スケールの上にプロットした2つの確率分布である[注 1]。どちらの図でも、赤で示した部分の面積が最初の桁が1である確率に比例しており、青で示した部分の面積が最初の桁が8である確率に比例している。 左側の分布では、赤と青の領域の面積比はおおよそそれぞれの幅の比に等しくなっている。幅の比は普遍的で、ベンフォードの法則によって厳密に与えられる。したがって、こうした確率分布に従う数値はおおむねベンフォードの法則に従う。 一方、右の分布では、赤と青の領域の面積比はその幅の比から大きく外れている。右の図でも幅の比は左側の分布と同じになっている。赤と青の領域の面積比は、その幅よりもむしろ高さの比に依存して決定されている。幅と異なり高さはベンフォードの法則に普遍的な関係を満たさない。代わりにその数値の分布の形によって完全に決定される。したがって、1桁目の数値の分布はベンフォードの

  • ガウス分布の導出

    偶然誤差の性質から確率論や統計学でよく用いられるガウス分布(正規分布)を導出してみよう。 真の値 \(X\) をもつある量の測定を行うことを考える。この測定には系統誤差は含まれず、偶然誤差のみが発生するものとしよう。偶然誤差については経験にもとづく次のガウスの公理がある: 大きさの等しい正と負の誤差は等しい確率で生じる。 小さい誤差は大きい誤差より起こりやすい。 ある限界値より大きな誤差は実際上起こらない。 さて、具体的にある測定を実施することで得られた測定値を \(x\) とすると、そのときの誤差 \(\varepsilon\) は \begin{equation} \varepsilon = x - X \label{error} \end{equation} で与えられる。ある大きさの偶然誤差が発生する確率を誤差 \(\varepsilon\) の関数とし、その確率密度関数を \(f

  • Standardized mortality ratio - Wikipedia

  • Kolmogorov–Smirnov test - Wikipedia

    Illustration of the Kolmogorov–Smirnov statistic. The red line is a model CDF, the blue line is an empirical CDF, and the black arrow is the KS statistic. In statistics, the Kolmogorov–Smirnov test (K–S test or KS test) is a nonparametric test of the equality of continuous (or discontinuous, see Section 2.2), one-dimensional probability distributions that can be used to test whether a sample came

    Kolmogorov–Smirnov test - Wikipedia
  • 1.3.5.16. Kolmogorov-Smirnov Goodness-of-Fit Test

    The Kolmogorov-Smirnov test (Chakravart, Laha, and Roy, 1967) is used to decide if a sample comes from a population with a specific distribution. The Kolmogorov-Smirnov (K-S) test is based on the empirical distribution function (ECDF). Given N ordered data points Y1, Y2, ..., YN, the ECDF is defined as \[ E_{N} = n(i)/N \] where n(i) is the number of points less than Yi and the Yi are ordered from

  • クロンバックの α 信頼性係数

    クロンバックの $\alpha$ 信頼性係数     Last modified: Aug 28, 2015 アンケート調査などで,対象とする領域のある特性を測定するために複数の質問項目への回答の合計値(特に尺度得点と呼ばれる)を使うことがある。尺度に含まれる個々の質問項目が内的整合性を持つかどうか(目的とする特性を測定する質問項目群であるか)を判定するために用いられる。 ケース $i$ の変数 $j$ の得点を $X_{ij}$ とし,総ケース数を $n$,変数 $j$ の平均値と不偏分散を $\bar{X}_j$,$S_j^2$,変数 $j$ と変数 $l$ の不偏共分散を $S_{jl}$,$k$ 個の変数の合計点 $Y_i\ (i = 1,2, ... ,n)$ の不偏分散を $S_Y^2$ としたとき, \[ \begin{align*} Y_i &= \sum_{j=1}^k

  • Rによるコルモゴロフ・スミルノフ検定

    Rにてコルモゴロフ・スミルノフ検定 (Kolmogorov-Smirnov test) を行う。コルモゴロフ・スミルノフ検定は得られた2つのデータ間の確率分布の相違の検定、または、1データにおける確率分布の正規性を行う検定法である。旧ソビエト連邦の数学者Andrey Nikolaevich KolmogorovとNikolai Vasilyevich Smirnovによって開発された。スチューデントのt検定等をはじめとする多くの検定手法において標分布 (データ) が正規分布に従うことが仮定されていることを考慮すると、得られたデータが正規分布に従うか否かは、その後の統計検定を行うにあたり非常に大きな意味を持つ。その観点からコルモゴロフ・スミルノフ検定は重要な検定法のひとつであるといえる。Rでは、デフォルトでインストールされているパッケージの関数 'ks.test' にて実行する。 以下のよ

  • R.4.28. 特異値分解 | R Financial & Marketing Library

  • ポアソン分布 - NtRand

    An Excel Add-In Random Number Generator Powered By Mersenne Twister Algorithm ENGLISH RSS ポアソン分布(Poisson distribution) 馬に蹴られてポアソン分布 概要 恋愛の話じゃありません。馬に蹴られて死んでしまう兵士の数の分布。これこそが歴史上初のポアソン分布の実用例だったのです。驚いたでしょ? ポアソン分布が現れる例は… ある交差点で1時間に起きる事故の件数 国道1キロメートル当たりのレストランの数 この原稿を書いている間に変換間違えをする数 などといったものが考えられます。このようにポアソン分布とは、時間(例えば1時間当たり)、場所(例えば1平方メートル当たり)、距離(例えば1キロメートル当たり)などある一定区間の中で、偶然に起こる事象の数の分布です。 でもこれは一般的には起こる確

    ポアソン分布 - NtRand
  • Stochastic gradient descent - Wikipedia

    Stochastic gradient descent (often abbreviated SGD) is an iterative method for optimizing an objective function with suitable smoothness properties (e.g. differentiable or subdifferentiable). It can be regarded as a stochastic approximation of gradient descent optimization, since it replaces the actual gradient (calculated from the entire data set) by an estimate thereof (calculated from a randoml

    Stochastic gradient descent - Wikipedia
  • 類似度と距離 - CatTail Wiki*

    2つのデータが似ている度合いを,類似度の大きさや距離の近さといった数値にしてあらわすことで,クラスタ分析や,k-近傍法,多次元尺度構成法(MDS)をはじめとするいろいろな分析を行うことが可能となる. ここでは,よく知られている類似度や距離について述べる. 類似度という概念は,2つの集合の要素がまさにどれだけ似ているかを数量化したものであり,距離とは,要素同士の離れ具合,従って非類似度とちかい概念と考えてもよい. 参考までに数学における距離の概念の定義を示すと, 距離空間の定義 Sを1つの空でない集合とし,dをSで定義された2変数の実数値関数 d(SxS) → R が,以下の4条件(距離の公理) D1 : (非負性) 任意のx,y∈Sに対して d(x,y)≧0. D2 : (非退化性) x,y∈Sに対し d(x,y)=0  ⇔ x=y. D3 : (対称性) 任意のx,y∈Sに対して d(x

    類似度と距離 - CatTail Wiki*
  • 1