タグ

statisticsに関するincepのブックマーク (97)

  • ラテン方格法 latin square design - 一般社団法人 日本理学療法学会連合

    ラテン方格を用いて割り付けを行う実験計画法のことを指します.たとえばn人の被験者にn種類の介入を行う実験をする場合,n行×n列の表を作り,行に被験者を,列に介入を行う順番を記入しておき,空いたマスに介入の種類を配列していきます.するとn種類の介入は次のようになります.①どの介入も1つの順序の中で1回実施されます.②どの被験者もすべての介入を1回経験します. 下図は3人の被験者(Aさん,Bさん,Cさん)に3種類の介入(a,b,c)を行う場合のラテン方格です.Aさん,Bさん,Cさんの3人全員が3種類の介入a,b,cを1回ずつ経験でき,配列に「釣り合い」がとれていることがわかります.また,これらの平均値は,順序効果に左右されないため,各被験者に平等の条件を与えることができるというメリットがあります.このようなn行×n列の表をラテン方格と言い,ラテン方格を用いることで介入や刺激の順序につり合いを持

  • 平均値の多重比較とは何? わかりやすく解説 Weblio辞書

    検定手順: 前提 帰無仮説 H0:「平均値に差はない」。 対立仮説 H1:「平均値に差がある」。 有意水準 α で両側検定を行う(片側検定も定義できる)。 ライアンの方法では,名義的有意水準(α ')という概念が使われる。k 群の場合,全ての 2 群の平均値の差を検定する場合には,kC2 回の検定を行わなければならない。検定結果全体としての有意水準を α とするためには,個々の検定において有意水準を α / kC2 まで下げておけばよい。しかし,もし平均値の最大値と最小値に有意な差が認められたときには,次の段階で k - 1 個の平均値の差を検定するときには,有意水準をもう少し大きくしてもよいであろう。このように考えると,個々の検定に使用する有意水準として,次式で表される名義的有意水準を使用すればよい。 α' = 2 α / { k ( m - 1 ) } ここで,m は比較する 2 個の

  • 【例題で解説】スティール・ドゥワス検定|Staat

    スティール・ドゥワス(Steel=Dwass)検定とは スティール・ドゥワス検定はマンホイットニーのU検定を3群以上の標に対して使えるようにした方法です. 多重比較の中で最も一般的な手法である,テューキー法のノンパラメトリック版でもあり,比較方法としては全ての2群同士を代表値の差が大きいか否かで判断します. 以下の図がスティール・ドゥワス検定の考え方になります.給与に対する満足度を役職ごとに比較する例になります. 4群に対して2群の代表値の差の比較を行なう場合,検定回数は6回必要になります.有意水準α=0.05で検定を6回繰り返すと有意になる確率は26%(=1-(1-0.05)6)に上昇します(多重性の問題). 多重性の問題を解決するためにスティール・ドゥワス検定では,比較する群数が増えるごとに厳しくした限界値(分布)を用いて仮説検定を行います. スティール・ドゥワス検定は比較するグルー

  • 最小記述長 - Wikipedia

    最小記述長(さいしょうきじゅつちょう、英: minimum description length, MDL)は、情報理論に基づくモデル選択基準である。 モデル選択とは、データに照らして何らかの意味で最適なモデル族(確率分布の集合)を検討する過程を指す。 MDLは、1978年、Jorma Rissanen により導入された。MDLでは、データをモデルを用いて圧縮・送信する際の符号長の最小化を考える。これはノイズを含むデータから意味のある規則性を抽出することにあたる。 最小記述長原理に基づくモデル選択指標としてNormalized Maximum Likelihood (NML)と、その罰則項を漸近展開して得られるFisher Information Approximation (FIA)がある。 MDLは (AICと違い) 離散データを扱う情報理論に基盤を置いているので、連続値データに対し使

  • Rによる統計入門

    はじめに このページでは R を用いた統計分析の基を解説しています。 目次 RとRStudioの導入 Google ColaboratoryでR言語を使う Rのデータ構造 データセットの作成と加工 その他のRの概念 図の作成 基的な統計分析 回帰分析 因子分析 テスト課題 画面上部の左端のアイコンを押すか、キーボードの S キーを押すとメニューの表示・非表示を切り替えることができます。

  • 交絡 - Wikipedia

    英語版記事を日語へ機械翻訳したバージョン(Google翻訳)。 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。 翻訳後、{{翻訳告知|en|Confounding|…}}をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明がありま

    incep
    incep 2020/05/26
    confounding,第1種過誤
  • 正規分布の基礎的な知識まとめ | 高校数学の美しい物語

    正規分布(ガウス分布)とは,図のような左右対称の連続型の確率分布です。正確な定義(確率密度関数)については後述します。 正規分布は最も代表的な分布の一つです。例えば物理などの実験における測定の誤差,テストの点数などは(ほぼ)正規分布に従う(ことが多い)と考えられています。 また,コイン投げのように,反復試行の成功回数が従う確率分布も(反復試行が多いとき,近似的に)正規分布になります。 →二項分布の正規近似(ラプラスの定理) この記事では,正規分布について,確率密度関数の式の意味や,平均・分散の導出を中心に解説します。 正規分布(ガウス分布)の確率密度関数は, f(x)=12πσexp⁡{−(x−μ)22σ2}f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left\{-\dfrac{(x-\mu)^2}{2\sigma^2}\right\}f(x)=2π​σ1​

    正規分布の基礎的な知識まとめ | 高校数学の美しい物語
  • What is the difference between normalisation and regularisation in machine learning

    incep
    incep 2019/11/12
    "Normalisation adjusts the data; regularisation adjusts the prediction function."
  • データから因果関係をどう導く?:統計的因果推論の基本、「反事実モデル」をゼロから - Unboundedly

    データに基づく因果推論がどのように行われるのか、詳しく説明していきます。因果の定義、因果推論に必要な条件、RCTの意義などいろいろまとめていたら、例のごとくすごいボリュームになってしまいました。なお、記事で使われる用語は、「疫学」の因果推論で使われているものが基です。同じコンセプトでも分野によって呼び方が違うので、その点はご了承ください。 まずは「因果効果」の定義から データから因果効果を求めるための前提条件 前提①:(Mean) Exchangeability 定義 交絡との関係性 ランダム化という魔法 観察データでの因果推論を可能にするConditional Exchangeability 前提②:Consistency 前提③:Positivity 前提条件のもと、データから平均因果効果を導く Exchangeabilityが成立しているとき(例:ランダム化比較試験) Condi

    データから因果関係をどう導く?:統計的因果推論の基本、「反事実モデル」をゼロから - Unboundedly
  • Private Presentation

    Private content!This content has been marked as private by the uploader.

    Private Presentation
  • 24-3. 2標本t検定とは | 統計学の時間 | 統計WEB

    2つの独立した母集団があり、それぞれの母集団から抽出した標の平均に差があるかどうかを検定することを「2標t検定」といいます。例えば、ある学校で行ったテストの点数が1組と2組とで差があるかどうかの検定や、被験者に対してある薬を投与する前後で血圧がどう変化したかの検定に使います。ただし、2つのデータが「対応のあるデータ」か「対応のないデータ」かによって検定統計量の算出方法が異なります。 ■対応がない場合の2標t検定の方法 異なる対象から抽出された2つの標は「対応のないデータ(対応なし)」です。 例えば、1組と2組の生徒は異なるので、それぞれのクラスから抽出された2つの標は「対応のないデータ」となります。 対応がない場合の2標t検定では、2つの標に対応がないことを加味した検定統計量を用いる必要があります。20-6章で学んだように、母分散が分からない場合、1群目の標平均を、母平均を

    24-3. 2標本t検定とは | 統計学の時間 | 統計WEB
  • 25-7. 母比率の差の検定 | 統計学の時間 | 統計WEB

    25-1章では母比率の検定方法について学びました。この章では、2つの標から得た標比率を使って母比率が等しいかを検定する方法について学びます。 例題: あるドラマの視聴率を調査したところ、関東地区では5,000世帯中1,000世帯が視聴していたことが分りました。一方、関西地区では3,000世帯中540世帯が視聴していました。この結果から、2地区の視聴率に差があるといえるでしょうか。

    incep
    incep 2019/01/24
    母比率の差の検定(母比率の検定).正解率等の比較に応用できる
  • irisの正体 (R Advent Calendar 2012 6日目) - どんな鳥も

    R Advent Calendar 2012の6日目です. Rのデータセットでもっとも有名なのが,irisではないでしょうか.FisherもしくはAndersonのアヤメの計測データですね.しかし,有名なわりには,このデータセットの正体はそれほどよく知られていないように思います (私もよく知らずに使っていました). そこで,このエントリでは,どんな研究でirisデータセットが報告されたのか,元の論文2報について,その概要を述べてみたいと思います ※1. アヤメIris属 (アヤメ属) はアヤメ科に含まれる属のうちのひとつで,世界の温帯に150種が知られているようです (アヤメ属 - Wikipedia).irisデータセットに含まれるIris setosa,Iris versicolor,Iris virginicaは,このアヤメ属に含まれる植物のうちの3種です. どんな論文で報告されたの

    irisの正体 (R Advent Calendar 2012 6日目) - どんな鳥も
  • ベンフォードの法則 - { 適用と制限 }Wikipedia

    上に示した2つの図は、対数スケールの上にプロットした2つの確率分布である[注 1]。どちらの図でも、赤で示した部分の面積が最初の桁が1である確率に比例しており、青で示した部分の面積が最初の桁が8である確率に比例している。 左側の分布では、赤と青の領域の面積比はおおよそそれぞれの幅の比に等しくなっている。幅の比は普遍的で、ベンフォードの法則によって厳密に与えられる。したがって、こうした確率分布に従う数値はおおむねベンフォードの法則に従う。 一方、右の分布では、赤と青の領域の面積比はその幅の比から大きく外れている。右の図でも幅の比は左側の分布と同じになっている。赤と青の領域の面積比は、その幅よりもむしろ高さの比に依存して決定されている。幅と異なり高さはベンフォードの法則に普遍的な関係を満たさない。代わりにその数値の分布の形によって完全に決定される。したがって、1桁目の数値の分布はベンフォードの

  • クロンバックの α 信頼性係数とは何? わかりやすく解説 Weblio辞書

    アンケート調査などで,対象とする領域のある特性を測定するために複数の質問項目への回答の合計値(特に尺度得点と呼ばれる)を使うことがある。尺度に含まれる個々の質問項目が内的整合性を持つかどうか(目的とする特性を測定する質問項目群であるか)を判定するために用いられる。 ケース i の変数 j の得点を Xij とし,総ケース数を n,変数 j の平均値と不偏分散を j,Sj2,変数 j と変数 l の不偏共分散を Sjl,k 個の変数の合計点 Yi( i = 1,2, ... ,n )の不偏分散を SY2 としたとき, である。合計点 Y の不偏分散は,上式ではなくて通常の計算方法で求めて良い。 クロンバックの α 信頼性係数はこれらの諸量により次式で求められる。 注意: 尺度得点は単なる合計点ではないことに注意が必要である。個々の質問項目に対する回答の選択肢に数値を割り当てるときには,質問項

  • Stan

    Stan is a state-of-the-art platform for statistical modeling and high-performance statistical computation. Many thousands of users rely on Stan for statistical modeling, data analysis, and prediction in the social, biological, and physical sciences, engineering, and business. Stan interfaces with the most popular data analysis languages (R, Python, shell, MATLAB, Julia, Stata) and runs on all majo

    Stan
  • ガウス分布の導出

    偶然誤差の性質から確率論や統計学でよく用いられるガウス分布(正規分布)を導出してみよう。 真の値 \(X\) をもつある量の測定を行うことを考える。この測定には系統誤差は含まれず、偶然誤差のみが発生するものとしよう。偶然誤差については経験にもとづく次のガウスの公理がある: 大きさの等しい正と負の誤差は等しい確率で生じる。 小さい誤差は大きい誤差より起こりやすい。 ある限界値より大きな誤差は実際上起こらない。 さて、具体的にある測定を実施することで得られた測定値を \(x\) とすると、そのときの誤差 \(\varepsilon\) は \begin{equation} \varepsilon = x - X \label{error} \end{equation} で与えられる。ある大きさの偶然誤差が発生する確率を誤差 \(\varepsilon\) の関数とし、その確率密度関数を \(f

  • EMD

    The Earth Mover's Distance The Earth Mover's Distance (EMD) is a method to evaluate dissimilarity between two multi-dimensional distributions in some feature space where a distance measure between single features, which we call the ground distance is given. The EMD ``lifts'' this distance from individual features to full distributions. Intuitively, given two distributions, one can be seen as a mas

    incep
    incep 2016/10/30
    確率分布同士の不一致の度合の測定手段.しかし,確率分布以外(例えばベクトル)にも適用可能.
  • トップページ - RESAS 地域経済分析システム

    地域経済分析システム(RESAS:リーサス)は、地方自治体の様々な取り組みを情報面から支援するために、内閣官房デジタル田園都市国家構想実現会議事務局が提供する、産業構造や人口動態、人の流れなどの官民ビッグデータを集約し、可視化するシステムです。

    トップページ - RESAS 地域経済分析システム
    incep
    incep 2015/10/28
    多分現在停止中.
  • UKP

    Welcome to the Ubiquitous Knowledge Processing (UKP) Lab! The UKP Lab was founded in 2009 by Prof. Dr. Iryna Gurevych and is part of the Computer Science Department at the Technical University of Darmstadt.

    UKP