タグ

統計に関するH1ROのブックマーク (15)

  • 主成分分析で標準偏差で割るべき?に対する議論 - Qiita

    TL;DR 主成分分析で標準化(標準偏差で割る)するのが必ずしもいいとは限らない それどころか標準偏差で割ることの悪影響もある 標準化すべきかどうかは、どこで主成分分析を使うか(可視化として使うのか、パイプラインとして使うのか)によっても異なるからそこをちゃんと考えましょう 主成分分析にも標準偏差で割る例と割らない例がある 「主成分分析をする際には標準化(正規化)をしましょう」と言われることはよくありますが、実はよく探すと割っている例と割っていない例があります。どちらで説明しているかは学者の間でも意見が分かれているようです。主成分分析を実行する前の変数変換を、 ケース1:平均だけ引く $X-\mu$ ケース2:平均で引いて標準偏差で割る $\frac{X-\mu}{\sigma}$ とする2通りです。大学が出している資料を見てみましょう。ケース1はオタゴ大学が出しているPDF 12ページ目

    主成分分析で標準偏差で割るべき?に対する議論 - Qiita
    H1RO
    H1RO 2020/07/11
    “そもそも標準化によって説明したい分散が変わっているのだから、標準化によって目標が変わっているわけです”
  • 東大情報学環大澤昇平氏の差別発言について - researchmap

    東京大学大学院情報学環特任准教授の大澤昇平氏(@Ohsaworks)が、11月20日にtwitter上で行った差別発言について書きます。この件については、11月24日に情報学環長名ですでに以下のような文書が出されています。 しかし残念ながら、上記の文書からは誰がどのような言動を行い、それがなぜ問題なのかということがわかりません。筆者(明戸)は現在同じ大学、同じ部局の特任助教であり(ただしプロジェクト雇用なので部局そのものの運営等には関わっていません)、また差別やヘイトスピーチにかかわる研究者でもあります。こうしたことをふまえて、ここでは明戸個人の立場から、今回の経緯および論点を整理し、自身の立場を明らかにしておこうと思います。

    H1RO
    H1RO 2019/11/25
    “統計的差別について... 統計は差別的な実態を含めて事実を事実として示すだけなので、現実に差別が存在する場合、統計のみに基づいた判断はそのまま差別の肯定につながります”
  • インフルエンザワクチン肯定派vs否定派

    名取宏(なとろむ) @NATROM インフルエンザワクチンの有効率は(報告によって差があるけど)40-60%ぐらい。ワクチンを打たなかったら10人がインフルエンザに罹るところ、ワクチンを摂取したら4~6人で済む。逆に言えばワクチンを摂取しても4~6人はインフルエンザに罹る。 twitter.com/nihon_koutei/s… 2019-01-21 23:55:17 日国黄帝 @nihon_koutei 正しい。インフルエンザワクチンの予防接種をしても罹るのは誰でも知っている筈。それにもし予防接種に効果があるのならば年々、接種率が上がって4割にも達しているのに大流行する筈がない。予防接種は気休めですらなく、単なる金儲けの為の道具だ。 twitter.com/kimuratomo/sta… 2019-01-19 10:56:37

    インフルエンザワクチン肯定派vs否定派
  • FX初心者必見。米国の重要経済指標13指標のまとめ - FX初心者向けまとめ解説(株式投資もあるよ)

    米国経済指標は超重要 >経済指標の発表はしばしば為替・株式市場で大きな話題になります。特に米国経済は、(世界経済に占めるシェアが低下し続けているとはいえ)世界最大の経済大国の指標であり、大きな注目が集まります。 >今回は比較的重要な経済指標をなるべく網羅的に取り上げ、その特徴を紹介することにします。 目次 米国経済指標は超重要 1.GDP成長率 2.ISM(全米供給管理協会)製造業景況感指数 3.ISM(全米供給管理協会)非製造業景況感指数 4.消費者物価指数(CPI) 5.個人消費価格指数(PCE) 6.耐久財受注 7.失業率 8.非農業雇用者数 9.失業保険申請件数 10.小売売上高 11.消費者信頼感指数 12.住宅着工件数(及び住宅着工許可件数) 13.中古住宅販売 1.GDP成長率 発表タイミング:四半期ごとの最終月の4週間後 市場インパクト:A ・米国経済全体で生み出した総付加

    FX初心者必見。米国の重要経済指標13指標のまとめ - FX初心者向けまとめ解説(株式投資もあるよ)
  • エラーページ - ヤフー株式会社

    指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。

    エラーページ - ヤフー株式会社
    H1RO
    H1RO 2018/05/26
    “また、「中学受験」や「TOEIC」といった勉強系の注目度も、東京を始めとした都市部で高いようです。 電車やタクシーをよく使い、ITに関心が高く、子供も大人も勉強している、そんな東京の姿が浮かび上がってきますね
  • 統計検定を理解せずに使っている人のために II

    408 化学と生物 Vol. 51, No. 6, 2013 15 μ σ μ σ μ σ 16 セミナー室 研究者のためのわかりやすい統計学-2 統計検定を理解せずに使っている人のために II 池田郁男 東北大学大学院農学研究科 15 16 409 化学と生物 Vol. 51, No. 6, 2013 μ σ σ σ μ σ * 17 μ σ μ σ * μ μ μ Z n 1 1 = − ( ) X µ σ σ 18 μ σ σ σ σ σ μ σ μ μ μ σ / n σ / n σ / n σ / n * * 17 18 σ 410 化学と生物 Vol. 51, No. 6, 2013 t u n 1 1 = − ( ) X µ σ σ σ σ σ μ t X 1 1 = − ( ) µ SE 19 μ μ μ μ μ 20 μ σ μ μ σ μ μ u n / 19 20 4

    H1RO
    H1RO 2018/03/19
  • 統計検定を理解せずに使っている人のために I - J-Stage

    318 化学と生物 Vol. 51, No. 5, 2013 セミナー室 研究者のためのわかりやすい統計学-1 統計検定を理解せずに使っている人のために I 池田郁男 東北大学大学院農学研究科 319 化学と生物 Vol. 51, No. 5, 2013 1 1 320 化学と生物 Vol. 51, No. 5, 2013 2 μ σ σ 3 * 2 3 * 321 化学と生物 Vol. 51, No. 5, 2013 4 * 5 * 6 σ 4 5 6 σ * * 322 化学と生物 Vol. 51, No. 5, 2013 μ μ μ μ μ σ 7 σ σ σ σ σ σ σ σ σ σ 8 8 9 7 σ 323 化学と生物 Vol. 51, No. 5, 2013 9 10 11 * σ σ * * * * 10 11 * * * * 324 化学と生物 Vol. 51, No.

  • 機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界

    さて、改めて今回の目的を確認しておくと、機械学習を使って東京都23区のお買い得賃貸物件を発見しよう、というものです。前回までの記事で、お買い得賃貸物件を発見するためのデータを収集し、分析にかけられるよう前処理してきました。 www.analyze-world.com www.analyze-world.com 今回の記事では、いよいよ機械学習を使って分析していきましょう。前回まではPythonを使っていましたが、この分析ではRを用いています。なお、コードはGitHub(https://github.com/ShoKosaka/Suumo)に上げておきますので興味ある方は参照ください。 最初に、データの中身をざっくり見ていきます。具体的には、分析のキーになるポイントをグラフにしながら、賃貸物件の現状や変数同士の関係性を把握していきます。 データ探索 まず、23区の中でどこが物件数が多いのかを

    機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界
  • 藤井四段で学ぶ最尤推定、MAP推定、ベイズ推定 - Qiita

    藤井四段の連勝が止まらないですね。 21日の対局に勝利して、連勝記録を1位タイの28連勝まで伸ばしてきました。26日の対局で勝利すれば単独トップになります。 そんな藤井四段の対戦成績は28勝0負。勝率でいうと1.000です。クラクラするような成績ですが、この「勝率」とは何かを少し数学的にみてみましょう。 単純に言葉だけをみると「藤井四段が勝利する確率」ではないかと考えられます。つまり $$P(\text{勝利}\ |\ \text{藤井四段}) = 1.0$$かのように感じます。 ではここで、26日の対局で藤井四段が勝利する確率はどれだけでしょう? $P(\text{勝利}\ |\ \text{藤井四段}) = 1.0$として考えると、これはつまり藤井四段は必ず勝つので、100%になってしまいます。しかし、もちろんそんなことはありません。藤井四段ですらも負けることはあるはずです。 実はここ

    藤井四段で学ぶ最尤推定、MAP推定、ベイズ推定 - Qiita
  • 高校数学の基本問題

    「あなたがまだやっていない問題」は、背景色・文字色の変化なし 「あなたが弱い問題」は、この色 「あなたが半分ぐらいできる問題」は、この色 「あなたがよくできる問題」は、この色

    H1RO
    H1RO 2016/10/09
  • 分散分析

    2ヶ月に1回開催予定の、分散分析入門講義の配布資料です。 分散分析をメインとして、その周辺の統計学の基礎的概念についても整理する予定です。 基的に、後の資料は前の資料の内容を前提として作成してありますので、 初学者の方は最初から読まれることをお勧めします。 なお、講義への参加ご希望の方がいらっしゃれば、トップページのアドレスよりメールでご連絡ください。 (注)基的な分布のパラメータの最尤推定量が求められることは仮定しています(第1回:資料3程度)が、 大学1年生レベルの線形代数・微分積分がマスターできていることは仮定せず、適宜ご説明します。 第1回(2008年4月26日(土)開催) 資料1:正規分布・t分布・χ^2分布・F分布とは何か? 資料2:不偏推定量・UMVUと大数の法則 資料3:最尤法と十分統計量 補足資料1:完備十分統計量についての補足 第2回(2008年5月24日(土)開催

    H1RO
    H1RO 2016/10/09
  • http://www012.upp.so-net.ne.jp/doi/biostat/CT39/distribution.pdf

    H1RO
    H1RO 2016/10/09
  • ウェルチのt検定について

    ウェルチのt検定 (Welch t-test) とはスチューデントのt検定と同じく、2つのデータ間の平均値の差に関するパラメトリック検定である。スチューデントのt検定が2つのデータの母分散が等しいと仮定できるときに用いる方法であるのに対し、ウェルチのt検定は2つのデータの母分散が等しいとは限らないときに用いる検定法である。検定法の名前に冠されているウェルチとは、検定法の開発者である20世紀のイギリスの統計学者 Bernard Lewis Welch に由来する。 ウェルチのt検定は以下のように行う。ここで、得られたデータはXおよびYであり、それぞれの標数はN1およびN2であるとする。これら2群間の母分散は等しいとは限らないという条件のもとでデータ間の平均値の差の検定を行う。データ間の対応はないので標数N1およびN2は一致している必要はない。 データX

    H1RO
    H1RO 2016/10/07
  • 5分で分かる!区間推定「信頼区間」の求め方

    区間推定は、標の統計量を元に、母集団の平均などを、幅(区間)を持たせて推定する統計学の手法です。この推定した幅を「信頼区間」と言います。例えば、100万のネジの長さの平均のように、母集団が大きい場合でも、区間推定を使えば、すべてのネジの長さを測らなくても、平均を推定することが出来ます。そこで今回は、母平均(母集団の平均)の信頼区間の求め方を、出来るだけ分かりやすくまとめてみました。 例題 とあるネジ工場で働くワン太郎は、上司から「型番Aのネジの長さの平均を調べておいて、急ぎだから今日中ね!」と頼まれました。しかし、型番Aのネジは100万以上あり、しかも遠方の倉庫に保管されているため、ワン太郎の手元には、型番Aのネジが「10」しかありません。(以下、型番Aのネジを単純に「ネジ」と表記します) またいつもの無茶振りだよ、、困ったなあと、ワン太郎は思いながら、とりあえずネジ10の長さを

    5分で分かる!区間推定「信頼区間」の求め方
    H1RO
    H1RO 2016/10/06
  • 統計についての見出し

    第1章 統計学って何に使うの? 第2章 アンケート調査について 第3章 データの種類とデータ分析の基礎 第4章 データの種類と統計手法の関係 第5章 推定 第6章 検定 第7章 分散分析 第8章 相関 第9章 多変量解析の概要 ◎統計処理のホームページでは以下の文献を参考にして作成されています。 1)菅 民郎、「一人で学べるやさしい統計学 上下」、社会情報サービス、1991年 2)菅 民郎、「多変量解析」、社会情報サービス、1991年 3)石村貞夫、「SPSSによる統計処理の手順」、東京図書、1998年 4)内田 治、「すぐわかるSPSSによるアンケートの調査・集計・解析」、東京図書、1998年 5)石村貞夫、「SPSSによる分散分析と多重比較の手順」、東京図書、1998年 6)石村貞夫、「SPSSによる多変量データ解析の手順」、東京図書、1999年

    H1RO
    H1RO 2016/10/06
  • 1