タグ

statisticsに関するsotukenyouのブックマーク (19)

  • MATLAB Note/統計/確率分布 - Miyazawa’s Pukiwiki 公開版

    確率分布(確率密度関数) † 確率分布の特性と分類に関して、さまざまな確率分布(滋賀大中川先生) に総合的な解説があります。 以下、Statistics Toolbox の関数を使用します。 参考:Statistics Toolbox でサポートされている確率分布 Rでも同じことができるはずです。R Note/統計/確率分布 を参照して下さい。 ↑ 連続変数(Continuous variable) † 連続的に変化する値の出現頻度を扱う分布。 【引用】 (略)棒が倒れる方向 X は、0 から 360°の間の任意の値を取ることができます。このような分布を連続型分布といいます。(略)ここで注意してもらいたいのは、離散型分布の確率関数とは異なり、確率密度関数 f(x) は、X が 値 x を取るときの確率を表しているわけではないことです。(略)なぜなら、倒れたときの角度がある特定の値に完全に一

  • 統計学入門−第10章

    10.3 ロジスティック回帰分析の計算方法 (1) 最小2乗法を利用する方法 ロジスティック回帰分析ではロジットの回帰誤差が特殊な分布になり、普通はその分布を理論的に確定することができません。 そのため回帰誤差が近似的に正規分布すると見なして、重回帰分析と同じように最小2乗法を利用して回帰分析を行う方法と、最尤法を利用した繰り返し近似計算によって回帰分析を行う方法の2種類があります。 最初に最小2乗法を利用する方法について説明しましょう。 この場合の線形ロジスティックモデルは次のようになります。 このモデルでは説明変数xjの値を研究者が任意に指定した時、ロジットの回帰誤差εが近似的に正規分布すると仮定します。 ただしロジスティック回帰式を計算するには回帰誤差の正規性は必要ではなく、検定を行う時だけ回帰誤差の正規性が必要になります。 そして説明変数は研究者が任意の値を指定するので誤差がなく、

  • 【LPOはDLPO】「猫」で説明します。ABテスト・多変量テスト - DLPO株式会社

    こんにちは! 今日はを使って、ABテストと多変量テストの違いをご説明できればと思います。 まずはA/Bテストです。二匹のがいて(AとB)、どちらのが可愛いのか知りたいです。WEBを通じて1万人に一人ずつ一匹だけを見せます。のパターンは二匹ですので、Aを見ている人は5,000人。Bを見ている人も5,000人。 今回の例でAを見た人は66%が可愛いと答えています。Bは34%と人気度が少し低めでした。 Aの大きな勝利です! ただし、このA/Bテストには二つの課題があります。 は二匹しか存在しないので 1) そもそもこの二匹以外に可愛いが存在するのでは?という疑問があります。 2) 上記のAはどういった理由で勝っているか不明です。勝ったのは耳が水色だから?ベロが出ているから?目が黒いから?そのが勝っている要因は闇の中です。 そこで「多変量テスト」の登場です。方法はほ

    【LPOはDLPO】「猫」で説明します。ABテスト・多変量テスト - DLPO株式会社
  • http://shower.human.waseda.ac.jp/~m-kouki/pukiwiki_public/117.html

  • 厚生労働統計一覧|厚生労働省

    このホームページを、英語中国語・韓国語へ機械的に自動翻訳します。以下の内容をご理解のうえ、ご利用いただきますようお願いします。 1.

  • 京都光華女子大学・京都光華女子大学短期大学部

    〒615-0882 京都市右京区西京極葛野町38 Copyright © Kyoto Koka Women's University All Right Reserved.

  • コルモゴロフ–スミルノフ検定 - Wikipedia

    コルモゴロフ–スミルノフ検定(コルモゴロフ–スミルノフけんてい、英: Kolmogorov–Smirnov test)は統計学における仮説検定の一種であり、有限個の標に基づいて、二つの母集団の確率分布が異なるものであるかどうか、あるいは母集団の確率分布が帰無仮説で提示された分布と異なっているかどうかを調べるために用いられる。しばしばKS検定と略される。 1標KS検定は、経験分布を帰無仮説において示された累積分布関数と比較する。主な応用は、正規分布および一様分布に関する適合度検定である。正規分布に関する検定については、リリフォースによる若干の改良が知られている(リリフォース検定)。正規分布の場合、一般にはリリフォース検定よりもシャピロ-ウィルク検定やアンダーソン-ダーリング検定の方がより強力な手法である。 2標KS検定は、二つの標を比較する最も有効かつ一般的なノンパラメトリック手法の

    コルモゴロフ–スミルノフ検定 - Wikipedia
  • pingコマンドで通信テストを行う

    「ping」コマンドは、ネットワークに接続されたパソコンなどで、通信テストを行う場合に使用します。 接続や設定が正しくできているかを確認する場合に便利です。 pingコマンドとは pingコマンドとは、ICMPというプロトコルを使用し、ネットワークを介して繋がっている機器への応答要求と、その要求に対する応答の確認を行うコマンドです。 相手側から正しく応答が返ってくれば、その間のネットワーク接続や設定に問題が無いことを確認できます。 応答要求を行う相手先は、コマンドの後へIPアドレスなどで指定します。 相手先は、パソコンだけでなく、ブロードバンドルータなどのネットワーク機器を指定することもできます。 ただし、相手先がpingコマンド(ICMPエコー)を受け付けない設定になっていると、応答は返ってきませんので、注意が必要です。 pingをオプションなしで実行する 相手先の機器と簡単な通信テスト

  • 酒気帯びアナライザー - 飲酒運転の違法性について

    交通違反は犯罪なのか? 2002年6月、飲酒運転の規制がとても厳しくなり、罰則も強化された。「交通事故を減らすための規制は大いに結構」と言いたいところであるが、厳しすぎる規制もまた問題だ。なぜなら強い薬には副作用があるからだ。 ところで警察は「交通違反は犯罪だ!」とアピールしている。でも違反と犯罪の区別には、とても重要な意味がある。 海外の例として、フランスとアメリカを見てみよう。 フランス 革命後のフランスでは、1808年には犯罪者取扱い法、そして1810年には刑法が作られた。 犯罪者取扱い法によって、強制捜査と、任意捜査が適正に行われるようになり、また刑法では、 crimes(犯罪), misdemeanors(軽犯罪), violations(違反)の3つが明確に区別されるようになった。そして、 この区別は1994年施行された刑法にも踏襲されている。 二つの国の例は、警察消極目的の原

  • テラバイトのデータ | 構造化知識研究センター

    テラバイトデータや構造化知識研究に関する過去の記事です。 1990年6月 コンピューターの中央処理装置4台を並列的につなぎ、人間のように推理したり連想したりするコンピューターの模擬実験に、九州大学の研究グループが成功した。1991年度にも20台に増結する計画で、最終的には1万台をつなぎ、人間の思考そっくりの柔軟性に富んだコンピューターシステムを目指す。キャリアウーマン並みの有能秘書や、建物の形状を判断できる掃除ロボットの開発にもつながると期待されており「人工知能」開発競争に一石を投じそうだ。 九州大学で実験に成功 模擬実験を行ったのは、九大総合理工学研究科の雨宮真人教授(情報システム専攻)のグループ。雨宮教授らは、記憶した知識で推論や連想を行う人間の思考回路網に着目。「物-果物-黄色-酸っぱい-レモン」など属性や因果関係でつながる情報を与えて連想ネットワークを構成。このネットワーク網をコ

  • 生態学データ解析 - 本/データ解析のための統計モデリング入門

    講義のーと の内容を詳しく説明したものです 著者: 久保拓弥 出版社: 岩波書店, シリーズ「確率と情報の科学」 編集: 甘利俊一,麻生英樹,伊庭幸人 このペイジの省略 URL: http://goo.gl/Ufq2 刊行と まちがい・修正一覧) 第 1 刷刊行: 2012 年 5 月 18 日 第 15 刷刊行: 2018 年 3 月 15 日 原稿時点の PDF ファイル (参考用) 目次, さくいん, まえがき 韓国語版 (翻訳は滋賀大の李鍾賛さん, 2017-09-15) 「統計モデリング入門」ネット上のあれこれ (のごく一部) 丸善・ジュンク堂書店の「今年驚いた! 1 冊」の「驚きの出版賞」 に選ばれました! (web archive, KuboLog 2012-12-20) Amazon カスタマーレビュー はてな出版物 -- 言及ブログへのリンクなどがあります! ブクログ,

  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.

  • 標準誤差 - Wikipedia

    英語版記事を日語へ機械翻訳したバージョン(Google翻訳)。 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。 翻訳後、{{翻訳告知|en|Standard error|…}}をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明が

  • 分散分析 - Wikipedia

    分散分析(ぶんさんぶんせき、英: analysis of variance、略称: ANOVA)は、観測データにおける変動を誤差変動と各要因およびそれらの交互作用による変動に分解することによって、要因および交互作用の効果を判定する、統計的仮説検定の一手法である。 分散分析の最も単純な形は,2つ以上の標の母集団が等しいかどうかを判断するt-検定であり、分散分析ではこれを一般化したものである。 統計学者で遺伝学者のロナルド・フィッシャーによって1920年代から1930年代にかけて基手法が確立された。そのため「フィッシャーの分散分析」「フィッシャーのANOVA法」とも呼ばれる。 基的な手法として、まず、データの分散成分の平方和を分解し、誤差による変動から要因効果による変動を分離する。次に、平方和を自由度で割ることで平均平方を算出する。そして、要因効果(または、交互作用)によって説明される平

  • カーネル密度推定 - Wikipedia

    正規分布の100個の乱数と異なる平滑化帯域幅によるカーネル密度推定。 カーネル密度推定(カーネルみつどすいてい、英: kernel density estimation)は、統計学において、確率変数の確率密度関数を推定するノンパラメトリック手法のひとつ。エマニュエル・パルツェン(英語版)の名をとってパルツェン窓(英: Parzen window)とも。大まかに言えば、ある母集団の標のデータが与えられたとき、カーネル密度推定を使えばその母集団のデータを外挿できる。 ヒストグラムは、一様なカーネル関数によるカーネル密度推定量と見ることもできる。

    カーネル密度推定 - Wikipedia
  • 2次元ヒストグラムを作成する

  • パラメトリックな手法とノンパラメトリックな手法

    パラメトリックな手法とノンパラメトリックな手法     Last modified: May 16, 2002 パラメトリックな手法 母集団の特性を規定する母数についてある仮説を設けるもので,平均値の差の検定($t$ 検定と略称されることが多い)や分散分析($F$ 検定と略称されることがある)などがこれに該当する。これらの検定手法では,母集団の正規性や等分散性が仮定される。 ノンパラメトリックな手法 母集団の分布型(母数)について一切の仮定を設けない。 このため,分布によらない手法と呼ばれることもある。 特に,標サイズが小さい場合には,それから求められた統計量の分布型は不正確なことが多く,パラメトリックな手法を適用することは不適切になりやすい。 しかし,ノンパラメトリックな手法は常に適用可能である。 このほかにも両者の相違点は数多く,それらは表 1 のようにまとめられる。

  • ROC曲線

    試験の点数から○○大学に合格(T)か不合格(F)かを予測したいときや,検査値から病気(T)か健康(F)かを判断したいときなどがあります。要するに,与えられた値から,真(TRUE)か偽(FALSE)かを判断したいわけです。 例として右の表のような場合を考えましょう。 与えられた値をどこで切っても,TとFは完全には分離できません。例えば11で切って,11以上を陽性(positive),11未満を陰性(negative)とした場合,10個のTのうち5個がpositiveに入りますので,true positive(真陽性)の割合は0.5です。また,5個のFのうち1個がpositiveに入りますので,false positive(偽陽性)の割合は0.2です。そこで,(0.2, 0.5) をプロットします。このように,区切る値(閾値,カットオフポイント)をいろいろ変えて,横軸にfalse positi

  • 交差検定 - Wikipedia

    交差検定(英: Cross-validation)とは、統計学において標データを分割し、その一部をまず解析して、残る部分を最初の解析の仮説検定に用いる手法[1] [2] [3]。 最初に解析するデータを「訓練事例(training set)」などと呼び、他のデータを「テスト事例(testing sets)」などと呼ぶ。 交差検定は Seymour Geisser が生み出した。特にそれ以上標を集めるのが困難(危険だったり、コストがかかったり)な場合、データが示唆する仮説を検証することに慎重になる必要がある。 [編集] 交差検定の主な種類 [編集] ホールドアウト検定 一般にホールドアウト検定は交差検定には分類されない。なぜなら、データを交差させることがないためである。初期標群から事例を無作為に選択してテスト事例を形成し、残る事例を訓練事例とする。テスト事例に使われるのは初期の標群の

  • 1