[B! statistics] sotukenyouのブックマーク

sotukenyou id:sotukenyou

statisticsに関するsotukenyouのブックマーク (19)

MATLAB Note/統計/確率分布 - Miyazawa’s Pukiwiki 公開版
確率分布（確率密度関数） † 確率分布の特性と分類に関して、さまざまな確率分布（滋賀大中川先生）に総合的な解説があります。以下、Statistics Toolbox の関数を使用します。参考：Statistics Toolbox でサポートされている確率分布 Rでも同じことができるはずです。R Note/統計/確率分布を参照して下さい。 ↑ 連続変数（Continuous variable） † 連続的に変化する値の出現頻度を扱う分布。【引用】（略）棒が倒れる方向 X は、0 から 360°の間の任意の値を取ることができます。このような分布を連続型分布といいます。（略）ここで注意してもらいたいのは、離散型分布の確率関数とは異なり、確率密度関数 f(x) は、X が値 x を取るときの確率を表しているわけではないことです。（略）なぜなら、倒れたときの角度がある特定の値に完全に一
sotukenyou 2014/11/06
データ

HMM

音響

関数

statistics

統計

標準偏差
リンク
統計学入門−第10章
10.3 ロジスティック回帰分析の計算方法 (1) 最小2乗法を利用する方法ロジスティック回帰分析ではロジットの回帰誤差が特殊な分布になり、普通はその分布を理論的に確定することができません。そのため回帰誤差が近似的に正規分布すると見なして重回帰分析と同じように最小2乗法を利用して回帰分析を行う方法と、最尤法を利用した繰り返し近似計算によって回帰分析を行う方法の2種類があります。最初に最小2乗法を利用する方法について説明しましょう。この場合の線形ロジスティックモデルは次のようになります。このモデルでは説明変数xjの値を研究者が任意に指定した時、ロジットの回帰誤差εが近似的に正規分布すると仮定します。ただしロジスティック回帰式を計算するには回帰誤差の正規性は必要ではなく、検定を行う時だけ回帰誤差の正規性が必要になります。そして説明変数は研究者が任意の値を指定するので誤差がなく、正
sotukenyou 2014/07/24
回帰分析

方法

statistics

統計
リンク
【LPOはDLPO】「猫」で説明します。ABテスト・多変量テスト - DLPO株式会社
- 198 users
- dlpo.jp
- 学び
こんにちは! 今日は猫を使って、ABテストと多変量テストの違いをご説明できればと思います。まずはA/Bテストです。二匹の猫がいて（猫Aと猫B)、どちらの猫が可愛いのか知りたいです。WEBを通じて1万人に一人ずつ一匹だけ猫を見せます。猫のパターンは二匹ですので、猫Aを見ている人は5,000人。猫Bを見ている人も5,000人。今回の例で猫Aを見た人は66%が可愛いと答えています。猫Bは34%と人気度が少し低めでした。猫Aの大きな勝利です！ただし、このA/Bテストには二つの課題があります。猫は二匹しか存在しないので 1) そもそもこの二匹以外に可愛い猫が存在するのでは?という疑問があります。 2) 上記の猫Aはどういった理由で勝っているか不明です。勝ったのは耳が水色だから？ベロが出ているから？目が黒いから？その猫が勝っている要因は闇の中です。そこで「多変量テスト」の登場です。方法はほ
sotukenyou 2013/11/14
web

方法

あとでみる

ネタ

statistics

マーケティング
リンク
http://shower.human.waseda.ac.jp/~m-kouki/pukiwiki_public/117.html
sotukenyou 2013/08/14
統計

matlab

データ

R

スクリプト

statistics

figure
リンク
厚生労働統計一覧｜厚生労働省
このホームページを、英語・中国語・韓国語へ機械的に自動翻訳します。以下の内容をご理解のうえ、ご利用いただきますようお願いします。 1.
sotukenyou 2013/08/06
結婚

statistics

analytics

調査・統計
リンク
京都光華女子大学・京都光華女子大学短期大学部
健康栄養学科健康スポーツ栄養専攻1年生の田中梓沙さんが【中国・ハルビン】アジア冬季競技大会2025フィギュアスケートで銅メダルを獲得しました
sotukenyou 2013/07/26
分析

データ

統計

statistics
リンク
コルモゴロフ–スミルノフ検定 - Wikipedia
コルモゴロフ–スミルノフ検定（コルモゴロフ–スミルノフけんてい、英: Kolmogorov–Smirnov test）は統計学における仮説検定の一種であり、有限個の標本に基づいて、二つの母集団の確率分布が異なるものであるかどうか、あるいは母集団の確率分布が帰無仮説で提示された分布と異なっているかどうかを調べるために用いられる。しばしばKS検定と略される。 1標本KS検定は、経験分布を帰無仮説において示された累積分布関数と比較する。主な応用は、正規分布および一様分布に関する適合度検定である。正規分布に関する検定については、リリフォースによる若干の改良が知られている（リリフォース検定）。正規分布の場合、一般にはリリフォース検定よりもシャピロ-ウィルク検定やアンダーソン-ダーリング検定の方がより強力な手法である。 2標本KS検定は、二つの標本を比較する最も有効かつ一般的なノンパラメトリック手法の
sotukenyou 2013/06/17
比較

TEST

数値解析

R

statistics
リンク
pingコマンドで通信テストを行う
「ping」コマンドは、ネットワークに接続されたパソコンなどで、通信テストを行う場合に使用します。接続や設定が正しくできているかを確認する場合に便利です。 pingコマンドとは pingコマンドとは、ICMPというプロトコルを使用し、ネットワークを介して繋がっている機器への応答要求と、その要求に対する応答の確認を行うコマンドです。相手側から正しく応答が返ってくれば、その間のネットワーク接続や設定に問題が無いことを確認できます。応答要求を行う相手先は、コマンドの後へIPアドレスなどで指定します。相手先は、パソコンだけでなく、ブロードバンドルータなどのネットワーク機器を指定することもできます。ただし、相手先がpingコマンド（ICMPエコー）を受け付けない設定になっていると、応答は返ってきませんので、注意が必要です。 pingをオプションなしで実行する相手先の機器と簡単な通信テスト
sotukenyou 2013/04/08
statistics
リンク
酒気帯びアナライザー　- 飲酒運転の違法性について
交通違反は犯罪なのか？ 2002年6月、飲酒運転の規制がとても厳しくなり、罰則も強化された。「交通事故を減らすための規制は大いに結構」と言いたいところであるが、厳しすぎる規制もまた問題だ。なぜなら強い薬には副作用があるからだ。ところで警察は「交通違反は犯罪だ！」とアピールしている。でも違反と犯罪の区別には、とても重要な意味がある。海外の例として、フランスとアメリカを見てみよう。フランス革命後のフランスでは、1808年には犯罪者取扱い法、そして1810年には刑法が作られた。犯罪者取扱い法によって、強制捜査と、任意捜査が適正に行われるようになり、また刑法では、 crimes（犯罪）, misdemeanors（軽犯罪）, violations（違反）の３つが明確に区別されるようになった。そして、この区別は1994年施行された刑法にも踏襲されている。二つの国の例は、警察消極目的の原
sotukenyou 2013/02/23
警察

日本

測定

海外

酒

statistics
リンク
「テラバイトデータ」プレナス投資顧問のAIの評判
プレナス投資顧問によると、日本のAI（人工知能）技術戦略は、官僚がその分野の権威筋の知恵を借りて作り上げるという形を取っている。しかしこの方式は、AIテラバイトデータ革命においては、あまりうまくいかない。なぜかというと、権威筋の学識は、AIテラバイトデータ革命のスピードに追いつけないし、また官僚の立案は、確実性と判断の誤りのないことが前提だが、AI革命では、この前提自体が成り立たないからだ。人材 AI開発の人材は、育成されるものではなく、育つ環境を与えて、余計な干渉をしないところに育つようだ。AI革新に学会の権威は役立たない。たとえば、リナックスを作り上げたリーナスとＯＳの権威であるタネンバウム教授との論戦を思い起こしてほしい。２０歳の無名の若者が学会の権威に真っ向からたてつき、教授に、「君が私のクラスにいれば進級できないだろう」といわせたのである。 ■第５世代コンピューターとは第５世
sotukenyou 2012/12/26
データマイニング

統計

研究

勉強

資料

statistics

学問
リンク
生態学データ解析 - 本/データ解析のための統計モデリング入門
講義のーとの内容を詳しく説明したものです著者: 久保拓弥出版社: 岩波書店, シリーズ「確率と情報の科学」編集: 甘利俊一，麻生英樹，伊庭幸人このペイジの省略 URL: http://goo.gl/Ufq2 刊行とまちがい・修正一覧) 第 1 刷刊行: 2012 年 5 月 18 日第 15 刷刊行: 2018 年 3 月 15 日原稿時点の PDF ファイル (参考用) 目次, さくいん, まえがき韓国語版 (翻訳は滋賀大の李鍾賛さん, 2017-09-15) 「統計モデリング入門」ネット上のあれこれ (のごく一部) 丸善・ジュンク堂書店の「今年驚いた! 1 冊」の「驚きの出版賞」に選ばれました! (web archive, KuboLog 2012-12-20) Amazon カスタマーレビューはてな出版物 -- 言及ブログへのリンクなどがあります! ブクログ,
sotukenyou 2012/12/26
データ

解析

コード

統計

Statistics

research

本

book
リンク
統計解析用フリーソフト・R-Tips
R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです．さまざまなプラットフォーム（OS）に対応しており，誰でも自由にダウンロードすることができます．それにも関わらず，世界中の専門家が開発に携わっており，日々新しい手法・アルゴリズムが付け加えられています．とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです．このドキュメントは Windows 版 R と Mac OS X 版 R（と一部 Linux 版 R ）でコマンドを調べた足跡です．ちなみに，この頁の内容を新しくした書籍はこちら，電子書籍版はこちらで販売されております．
sotukenyou 2012/12/18
programming

プログラミング

統計

統計学

解説

statistics
リンク
標準誤差 - Wikipedia
英語版記事を日本語へ機械翻訳したバージョン（Google翻訳）。万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。翻訳後、{{翻訳告知|en|Standard error|…}}をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明が
sotukenyou 2012/12/18
データ

統計

Statistics

Mathematics

測定
リンク
分散分析 - Wikipedia
分散分析（ぶんさんぶんせき、英: analysis of variance、略称: ANOVA）は、観測データにおける変動を誤差変動と各要因およびそれらの交互作用による変動に分解することによって、要因および交互作用の効果を判定する、統計的仮説検定の一手法である。分散分析の最も単純な形は，2つ以上の標本の母集団が等しいかどうかを判断するt-検定であり、分散分析ではこれを一般化したものである。統計学者で遺伝学者のロナルド・フィッシャーによって1920年代から1930年代にかけて基本手法が確立された。そのため「フィッシャーの分散分析」「フィッシャーのANOVA法」とも呼ばれる。基本的な手法として、まず、データの分散成分の平方和を分解し、誤差による変動から要因効果による変動を分離する。次に、平方和を自由度で割ることで平均平方を算出する。そして、要因効果（または、交互作用）によって説明される平
sotukenyou 2012/12/14
excel

言語

プログラム

用語

統計

統計学

Statistics

分散分析

卒論
リンク
カーネル密度推定 - Wikipedia
正規分布の100個の乱数と異なる平滑化帯域幅によるカーネル密度推定。カーネル密度推定（カーネルみつどすいてい、英: kernel density estimation）は、統計学において、確率変数の確率密度関数を推定するノンパラメトリック手法のひとつ。エマニュエル・パルツェン（英語版）の名をとってパルツェン窓（英: Parzen window）とも。大まかに言えば、ある母集団の標本のデータが与えられたとき、カーネル密度推定を使えばその母集団のデータを外挿できる。ヒストグラムは、一様なカーネル関数によるカーネル密度推定量と見ることもできる。
sotukenyou 2012/10/11
関数

wikipedia

Math

estimation

kernel

mathematics

statistics
リンク
2次元ヒストグラムを作成する
sotukenyou 2012/10/11
column

設定

statistics
リンク
パラメトリックな手法とノンパラメトリックな手法
パラメトリックな手法とノンパラメトリックな手法　　　　　Last modified: May 16, 2002 パラメトリックな手法母集団の特性を規定する母数についてある仮説を設けるもので，平均値の差の検定（$t$ 検定と略称されることが多い）や分散分析（$F$ 検定と略称されることがある）などがこれに該当する。これらの検定手法では，母集団の正規性や等分散性が仮定される。ノンパラメトリックな手法母集団の分布型（母数）について一切の仮定を設けない。このため，分布によらない手法と呼ばれることもある。特に，標本サイズが小さい場合には，それから求められた統計量の分布型は不正確なことが多く，パラメトリックな手法を適用することは不適切になりやすい。しかし，ノンパラメトリックな手法は常に適用可能である。このほかにも両者の相違点は数多く，それらは表 1 のようにまとめられる。
sotukenyou 2012/10/03
統計

学習

まとめ

statistics

院試

０数理系
リンク
ROC曲線
試験の点数から○○大学に合格（T）か不合格（F）かを予測したいときや，検査値から病気（T）か健康（F）かを判断したいときなどがあります。要するに，与えられた値から，真（TRUE）か偽（FALSE）かを判断したいわけです。例として右の表のような場合を考えましょう。与えられた値をどこで切っても，TとFは完全には分離できません。例えば11で切って，11以上を陽性（positive），11未満を陰性（negative）とした場合，10個のTのうち5個がpositiveに入りますので，true positive（真陽性）の割合は0.5です。また，5個のFのうち1個がpositiveに入りますので，false positive（偽陽性）の割合は0.2です。そこで，(0.2, 0.5) をプロットします。このように，区切る値（閾値，カットオフポイント）をいろいろ変えて，横軸にfalse positi
sotukenyou 2012/09/18
アルゴリズム

性能

健康

研究

statistics

ROC curve
リンク
交差検定 - Wikipedia
交差検定（英: Cross-validation）とは、統計学において標本データを分割し、その一部をまず解析して、残る部分を最初の解析の仮説検定に用いる手法[1] [2] [3]。最初に解析するデータを「訓練事例（training set）」などと呼び、他のデータを「テスト事例（testing sets）」などと呼ぶ。交差検定は Seymour Geisser が生み出した。特にそれ以上標本を集めるのが困難（危険だったり、コストがかかったり）な場合、データが示唆する仮説を検証することに慎重になる必要がある。 [編集] 交差検定の主な種類 [編集] ホールドアウト検定一般にホールドアウト検定は交差検定には分類されない。なぜなら、データを交差させることがないためである。初期標本群から事例を無作為に選択してテスト事例を形成し、残る事例を訓練事例とする。テスト事例に使われるのは初期の標本群の
sotukenyou 2012/09/03
Validation

datamining

statistics

research

math

統計

解析
リンク
1