タグ

統計学に関するsotukenyouのブックマーク (25)

  • t検定 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "T検定" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2015年9月) t検定(ティーけんてい)とは、帰無仮説が正しいと仮定した場合に、統計量がt分布に従うことを利用する統計学的仮説検定の総称である。母集団が正規分布に従うと仮定するパラメトリック検定法であり、t分布が直接、もとの平均や標準偏差にはよらない(ただし自由度による)ことを利用している。2組の標について平均に有意差があるかどうかの検定などに用いられる。統計的仮説検定の一つ。日産業規格では、「検定統計量が,帰無仮説の下でt分布に従うことを仮定して行う統計的検定。」と定義してい

  • http://atiboh.sub.jp/t07kaikibunseki.html

    ど素人の「Excel 回帰分析」表の見方 (単回帰分析) Excel ・ 分析ツールの「回帰分析」は、Excelが提供する便利な機能の一つです。 [注] : ど素人の「Excel 回帰分析」表の見方は、「回帰分析」の各出力項目を関数等に当てはめてみたものですので、統計学の理論説明はありません。統計無脳ですので。(・_- ;;ゞ ハジ ・回帰分析 : 相関関係や因果関係があると思われる2つの変数のうち、一方の変数から将来的な値を予測するための予測式(回帰直線)を求めるための手法です。2組のデータの傾向を分析するために行われます。 ・単回帰分析 : 説明変数が1つの場合の回帰分析 (重回帰分析は、説明変数が、複数ある場合の回帰分析です。) ・目的変数 (従属変数又は被説明変数) : 予測される側の変数 y ・説明変数 (独立変数) : 予測に用いられる変数x1、x2、x3・・・ ・

  • Q1

    Q1:相関と回帰の違いは何か?2つの変数の比例関係を見る点では相関も回帰分析も変わりないように思われるが…。 A1:2変数がどれくらい散らばっているかを表すのが相関[係数]である(図1a)。一方の変数から他方の変数を予測するために最も都合の良い直線を引くのが回帰[分析]である(図1b)。これらの目的は根的に異なり,Altman1)も両者を同時に求めることはあり得ないと述べている。従って,事前に「比例関係」とは何かを明確に定義づけて使い分けるのがポイントとなろう。 同一のデータであっても,相関係数と回帰係数が大きく異なることは意外に多い。1つの例を挙げよう。図2aは相関係数と回帰係数が,ともに1の直線関係にある例である。さて図2bは図2aと比べて回帰式が変化せず,相関係数のみが低くなった例である。回帰係数はyに対し,x方向からみて誤差が最小となるような直線を引くから1になるのである。もちろ

  • 産総研:ビッグデータから新たな科学的発見をもたらす統計手法を開発

    ビッグデータからの科学的発見のためには、正確な検定値(P値)の算出が必要。 超高速アルゴリズムを用いた新たな統計検定手法を開発し、発見力を大幅に改善した。 物理学、医学、化学など全ての実験科学において世界中での広い利用が期待される。 JST 課題達成型基礎研究の一環として、産業技術総合研究所 生命情報工学研究センターの津田 宏治 主任研究員(JST ERATO「湊離散構造処理系プロジェクト」グループリーダー)、東京工業大学 大学院情報理工学研究科 計算工学専攻の瀬々 潤 准教授、理化学研究所 統合生命医科学研究センターの岡田 眞里子 チームリーダーらは、従来に比べて格段に高い精度で誤発見の確率を示す検定値(P値)を計算するアルゴリズム(手順)を開発しました。 自然科学で得られるデータ量は増加の一途をたどり、これらを有効に解析できる方法が望まれています。しかし、従来の統計検定手法は観測できる

  • 尤度関数と最尤推定量(maximum likelihood estimato

    尤度関数と最尤推定値 池に何尾魚がいるかを調べるために、ある日100尾を捕獲し目印を付けてから放し、しばらく間をおいてからまた100尾を捕獲してみたところ、その中に先日目印を付けた魚が10尾見つかりました。このデータから池には何尾の魚がいると推定できるでしょうか。この問題を解くには「超幾何分布」を応用するのがよいと思われますが、そのために、この問題を一般化することにします。すなわち のようにしますと、この標の確率変数の確率は次のような超幾何分布にしたがって のようになります。この式から池の魚の全数を求めたいわけが、確率の値がわからない限り求まりそうにもありません。そこで、ここから推定をしなければなりません。まず、いま現在わかっているだけの状況を考えると の合計の数だけの魚が池には最低限いることになります。したがって、その数は となります。それでは、この魚の数だけ池にいたとすると、確率はど

    尤度関数と最尤推定量(maximum likelihood estimato
  • 尤度関数 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "尤度関数" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2014年9月) 尤度関数(ゆうどかんすう、英: likelihood function)とは統計学において、ある前提条件に従って結果が出現する場合に、逆に観察結果からみて前提条件が「何々であった」と推測する尤もらしさ(もっともらしさ)を表す数値を、「何々」を変数とする関数として捉えたものである。また単に尤度ともいう。 その相対値に意味があり、最尤法、尤度比検定などで用いられる。 概要[編集] B = b であることが確定している場合に、 A が起きる確率(条件付き確率)を とする

  • 統計屋はどこまで給料をもらうべきか - Willyの脳内日記

    アカデミアでもビジネスでも統計解析のニーズは高くて、 データを分析して欲しいというような依頼は結構くる。 しかし、分析の対価としてどこまで給料をもらうべきなのか、 というのはなかなか難しい問題だ。 完全にビジネスとして外注して、博士レベルの統計屋に 分析をさせると、単価は1時間で100ドル前後のようだ。 以前に、コンサルティング会社が時給75ドルでそういった求人を 出していたから、マージンなどを考えれば大体そんなものなのだろう。 継続的に分析案件が発生するのであれば、 常勤で統計屋を雇えばもっと安く済む。 私も、大学院生の時は、医学部でデータの分析をして、 生活費や給料、健康保険料を払ってもらっていた。 一番厄介なのは、依頼者が案件をあくまで「共同研究」だと考えている場合である。 もちろん雑誌や学会等に投稿することになれば、 分析者として共著者に名前を入れてもらうことになるが、 それが統計

  • 尤度(ユウド)とは? 意味や使い方 - コトバンク

    確率密度関数において確率変数に観測値を代入したものをいう。つまり,確率密度を観測値で評価した値である。また,これを未知母数の関数とみるとき,とくに尤度関数という。尤度関数の自然対数は対数尤度と呼ぶ。観測値とその確率分布が与えられたとき,尤度あるいは対数尤度を最大にする母数の値は,母数の一つの自然な推定量を与える。これは最尤推定量と呼ばれ,標サイズが大きくなると母数の真値に漸近的に一致するとか,漸近的に正規分布に従うなど,いろいろ好ましい漸近的性質をもつ。 執筆者:広津 千尋

    尤度(ユウド)とは? 意味や使い方 - コトバンク
  • 機械学習チュートリアル@Jubatus Casual Talks

    機械学習の社会実装では、予測精度が高くても、機械学習がブラックボックであるために使うことができないということがよく起きます。 このスライドでは機械学習が不得意な予測結果の根拠を示すために考案されたLIMEの論文を解説します。 Ribeiro, Marco Tulio, Sameer Singh, and Carlos Guestrin. "" Why should i trust you?" Explaining the predictions of any classifier." Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. 2016.

    機械学習チュートリアル@Jubatus Casual Talks
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • t検定

    この教材では,対応がないときのt検定について,上記の学説の優劣を判断していません.読者に判断してもらうための材料を提供しているレベルですのでよろしく.(2群の要素数が僅差であるような場合を除けば,多くの場合にWelch検定の方が自由度がかなり小さくなるので,レポートを見れば,どちらのt検定を用いたのかは分かると言われています.) 【平均の差の検定:要約】 ◎ 前提:以下において母集団は正規分布に従うとする. 幾つかのグループの「平均の差」が偶然的な誤差の範囲にあるものかどうかを判断したいとき,データの個数が少ないときは偶然的な誤差の範囲も大きくなるが,データの個数が多くなると平均の差が大きな値となることはめったにない. 同一の母集団からの標と見なしたときに2つのグループの平均の差が両側5%の確率の範囲に入るようなことはめったになく,このような場合は平均に有意差があるとして異なる母集団から

  • 医学は疑問から始まる mean±SD

    透析室に勤務している臨牀工学技士です。 日々の不満や、色々と調べてみた事を綴ります。 医療従事者の一人として、プロフェッショナルでありたい、と考えています。 未熟者ですが、よろしくお願いします。 『信頼性の統計学』を読んでいて・・・ そういえばそうだなぁと感じた事が、研究会等で見かけるスライドのグラフについてです。 ほとんどの場合mean±SD(平均値±標準偏差)で示されているわけですが・・・ 正規分布を考えると、mean±1SDでは全データの68.3%、まぁ約2/3が含まれている事になるわけです。 mean±2SDであれば、95.5%が含まれている事になります。 『信頼性の統計学』の中では、「mean±SDでは68%信頼区間にし過ぎず誤解を招く」とし、95%信頼区間で示す様にと述べています。 mean±SDが慣習的に使われているのってなぜなのでしょうね。 その方が見易いから、でしょうか?

  • キュムラント - Wikipedia

    確率論や統計学において、キュムラント(きゅむらんと、英: cumulant)は、分布を特徴付ける特性値の一つ。キュムラント母関数を級数展開した際の係数として定義する。その性質を研究したT. N. ティエレに因み[1] 、ティエレの半不変数(英: semi-invariant)とも呼ぶ[2]。 定義[編集] 確率変数Xに対して、 で定義されるモーメント母関数の対数log M(s)をキュムラント母関数と呼ぶ。但し、⟨…⟩は期待値を取る操作を表すものとする。キュムラント母関数の級数展開 において、係数cnをn次のキュムラントもしくは、ティエレの半不変数と呼ぶ。この級数展開がn=0の項を含まないことは、logM(0) = log 1 = 0よりわかる。キュムラントを表す記号としてcnのほかに、κnやモーメント⟨Xn⟩に対応した⟨Xn⟩cが用いられる。また、確率変数のべき乗Xnに対し を与える操作を

  • 仮説検定 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "仮説検定" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2013年5月) 仮説検定(かせつけんてい、英: hypothesis testing)あるいは統計的仮説検定 (statistical hypothesis testing)[補 1] とは、母集団分布の母数に関する仮説を標から検証する統計学的方法の一つ。日産業規格では、仮説 (statistical hypothesis) を「母数又は確率分布についての宣言。帰無仮説と対立仮説がある。」と定義している[1]。検定 (statistical test) を「帰無仮説を棄却し対

  • 有意差(ゆういさ)の意味や定義 わかりやすく解説 Weblio辞書

    (有意差 から転送) 出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/10/17 03:29 UTC 版) 有意(ゆうい、独: Signifikanz、英: significance)は、確率論・統計学の用語で、「確率的に偶然とは考えにくく、意味があると考えられる」[1]ことを指す。科学分野での用語として、有意である(significant)とは「注目に値するほど大きい、ないしは重要である」という意味も持つ[2]。 ^ "有意". デジタル大辞泉. コトバンクより2022年2月10日閲覧。 ^ “significant - Quick search results | Oxford English Dictionary”. www.oed.com. 2023年9月4日閲覧。 ^ 2015 T&F社のBASP誌がP値の使用禁止を発表 https://www.edi

  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.

  • 母集団,標本,平均,分散,標準偏差

    ■母平均,母比率の推定 母集団から標を抽出して,標調査によって母集団の性質を調べることを考える. 標の要素の個数を「標の大きさ」といいnで表わす. ※ 「標」という用語は,個々のもの(個々のデータ)を指すのでなく,母集団から取り出された集合(部分集合)に付けられた名前となっており,「標の大きさ」という用語は個々のデータの大きさのことでなく,標という集合の要素の個数を示している. ○1 母平均 μ ( ミュー:ギリシャ文字 ) ,母標準偏差 σ ( シグマ:ギリシャ文字 ) の母集団から大きさ n の無作為標を復元抽出するとき,

  • 信頼区間 - Wikipedia

    英語版記事を日語へ機械翻訳したバージョン(Google翻訳)。 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。 翻訳後、{{翻訳告知|en|Confidence interval|…}}をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針につい

    信頼区間 - Wikipedia
  • 研究者の多くはエラーバーの意味をろくに理解していない - 音風景ブログ

    研究者の多くはエラーバーの意味をろくに理解していない 今日、私は認知科学日記の読者がエラーバーをどれだけ理解しているかを問うオンライン投票を開始した――エラーバーとはよくグラフに乗っている、あの小さなI字型の、統計学の賜物である。正しく理解していないだろうということは、大体予想済みである。なぜそんなに自信があるかって? それは2005年、サラ・ベリア(Sarah Belia)らのチームが、最前線の心理学、神経科学、医学ジャーナルに論文を掲載したことがある数百人の研究者を対象に行った研究成果があるからである。彼らのうちエラーバーと有意さの関係について正しい知識を示したのはほんの一握りであった。論文を掲載した研究者たちができないなら、どうしてカジュアルなブログの読者ができることを前提としてよいだろうか? 信頼区間 まずそもそも、問題の解決法を知るため、少々の説明が必要である。信頼区間というコン

    研究者の多くはエラーバーの意味をろくに理解していない - 音風景ブログ
  • 分散分析 - Wikipedia

    分散分析(ぶんさんぶんせき、英: analysis of variance、略称: ANOVA)は、観測データにおける変動を誤差変動と各要因およびそれらの交互作用による変動に分解することによって、要因および交互作用の効果を判定する、統計的仮説検定の一手法である。 分散分析の最も単純な形は,2つ以上の標の母集団が等しいかどうかを判断するt-検定であり、分散分析ではこれを一般化したものである。 統計学者で遺伝学者のロナルド・フィッシャーによって1920年代から1930年代にかけて基手法が確立された。そのため「フィッシャーの分散分析」「フィッシャーのANOVA法」とも呼ばれる。 基的な手法として、まず、データの分散成分の平方和を分解し、誤差による変動から要因効果による変動を分離する。次に、平方和を自由度で割ることで平均平方を算出する。そして、要因効果(または、交互作用)によって説明される平