タグ

統計に関するamadeusのブックマーク (22)

  • 確率分布 Navi - NtRand

    確率分布 Navi 星の数ほどある確率分布から、あなたの目的にピッタリの分布がきっと見つかる! (データの特徴から最適な分布を見つける⇒確率分布の世界) が付いている分布は NtRand3 に乱数生成関数を始めとした関連関数が用意されています。その他の分布も、NtRand3 の関数を使って乱数を生成する方法を解説しています。

  • Most researchers don't understand error bars | ScienceBlogs

    [This post was originally published in March 2007] Earlier today I posted a poll [and I republished that poll yesterday] challenging Cognitive Daily readers to show me that they understand error bars -- those little I-shaped indicators of statistical power you sometimes see on graphs. I was quite confident that they wouldn't succeed. Why was I so sure? Because in 2005, a team led by Sarah Belia co

  • 研究者の多くはエラーバーの意味をろくに理解していない - 音風景ブログ

    研究者の多くはエラーバーの意味をろくに理解していない 今日、私は認知科学日記の読者がエラーバーをどれだけ理解しているかを問うオンライン投票を開始した――エラーバーとはよくグラフに乗っている、あの小さなI字型の、統計学の賜物である。正しく理解していないだろうということは、大体予想済みである。なぜそんなに自信があるかって? それは2005年、サラ・ベリア(Sarah Belia)らのチームが、最前線の心理学、神経科学、医学ジャーナルに論文を掲載したことがある数百人の研究者を対象に行った研究成果があるからである。彼らのうちエラーバーと有意さの関係について正しい知識を示したのはほんの一握りであった。論文を掲載した研究者たちができないなら、どうしてカジュアルなブログの読者ができることを前提としてよいだろうか? 信頼区間 まずそもそも、問題の解決法を知るため、少々の説明が必要である。信頼区間というコン

    研究者の多くはエラーバーの意味をろくに理解していない - 音風景ブログ
  • https://www.uvm.edu/~statdhtx/

  • Logics of Blue

    はじめてきた方はサイト案内やサイトマップをご覧ください。 管理人Twitter始めました。一部のコードはGitHubで管理するようにしました。 プライバシーポリシーはこちらです。 ★2022年度の統計学の講義資料はこちらから閲覧できます。 ●書籍情報:Pythonで学ぶあたらしい統計学の教科書 [第2版] 書籍のサポートページはこちらです(サンプルコードやデータもこちらです)。 ●書籍情報:意思決定分析と予測の活用 基礎理論からPython実装まで 書籍のサポートページはこちらです(サンプルコードやデータもこちらです)。 ●書籍情報:R言語ではじめるプログラミングとデータ分析 書籍のサポートページはこちらです(サンプルコードやデータもこちらです)。 ●書籍情報:RとStanではじめる ベイズ統計モデリングによるデータ分析入 書籍のサポートページはこちらです(サンプルコードやデータもこちらで

  • http://home.hiroshima-u.ac.jp/ksatoh/documents/Rchap5.txt

  • Rの基本パッケージ中の古典的検定関数一覧 - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですR は豊富な代表的古典的検定関数(パラメトリック、ノンパラメトリック検定)を持つ。 注意:帰無分布(帰無仮説の下での検定統計量の分布)に付いては、正確な分布を用いるものと、近似分布を 用いるものがある。両者がオプションで選べるものもあれば、近似分布しか使えないものもある。 R の検定関数は検定の副産物として、関連パラメータの信頼区間を同時に計算するようになっている。 注意:統計量の帰無仮説の下での分布を漸近近似で求めるものが多数を占める。こうした場合一般論として データの数がある程度大きいことが前提条件になる。特にヘルプドキュメントに注意が無いことが多いが、実際は 近似が不十分と思われる場合は警告が出る関数がある。 ノンパラメトリック検定関数 † ノンパラメトリック検定とは、通常母集団分布に

  • 多変数の相関を可視化する方法メモ - 草薙の研究ログ

    自分のためのメモ。 因子分析したら因子分析の結果だけ,構造方程式モデリングしたらパス図だけ,そういうのはちょっと好かない。殆どの場合相関行列があればそういうのは再現できるし,相関行列だって上手に可視化したら,例えば因子分析くらいの見通しはつく。これは,研究報告の透明性というのにもつながる。 ただ論文には紙幅の都合があって,いつでも,というわけにはいかないけど。 とにかく多変数の相関行列に対応するようなデータの可視化について,Rを用いてメモしていく。自分ですぐ忘れてしまうから。 (スクリプトの中に不自然に半角スペースとか入っているのは,hatena記法と変に被るところを避けるため) 散布図行列(SPLOM) 一番てっとり早い方法。 まずRのデフォルト関数で「データフレーム形式」でデータを読み込む。 例えばエクセルからクリップボードにコピーした状態なら, dat<- read="" table

    多変数の相関を可視化する方法メモ - 草薙の研究ログ
    amadeus
    amadeus 2014/07/25
    [pairs][psych][LOESS][局所多項式あてはめ][rug][無向グラフ][cor][qgraph][主座標分析][多次元尺度構成法][corrgram][コリログラム]
  • 統計の落とし穴と蜘蛛の糸|実験医学online:羊土社 - 羊土社

    「実験医学」に2014年2月から開始した連載「統計の落とし穴と蜘蛛の糸(三中信宏)」が単行化いたします.人間が進化の過程で得てきた「認知的性向」は統計学の質ともいえるものです.単なる計算方法や理論ではなく,「ものの考え方」としての統計的思考について,分野の歴史から,科学哲学の視点も含めつつご紹介いただきます.実験医学online上では引き続き第1回をご覧いただけますのでぜひご一読ください.(編集部) 私の職務上の表看板は「生物統計学」です.農林水産省系の独立行政法人農業環境技術研究所を務地とし,兼任している東京大学農学部にも研究室をもっています.そういうポジションにいれば,ごく日常的に,農学系あるいは生物科学系の研究員や学部生・大学院生に統計学を教える機会が多くなり,また統計分析に関する質問を受けるコンサルタント業務も年々増えてきました.仕事や研究を進めるうえで統計分析とかデータ解析

  • 世界最高の選手リオネル・メッシの何がすごいのかが統計的データ分析で明らかに

    ネイト・シルバー氏といえば、米大統領選の勝敗を全50州分的中させたり、野球選手の成績を予測するための統計ツールPECOTAを開発した人物として知られる天才データアナリストです。そんなネイト・シルバー氏が新しく立ち上げた、統計を使ってあらゆる事象を分析するニュースサイトがFiveThirtyEightで、ここでスポーツ関連のデータアナリスト兼ライターを務めるBenjamin Morrisさんが現在世界ナンバーワンのサッカー選手と目されているリオネル・メッシ選手に関するさまざまなデータを分析しまくったところ、メッシ選手は通常ではほとんど不可能な要素を両立しまくったまさにミラクルな選手であることが判明しました。 Lionel Messi Is Impossible | FiveThirtyEight http://fivethirtyeight.com/features/lionel-messi

    世界最高の選手リオネル・メッシの何がすごいのかが統計的データ分析で明らかに
  • 生態学データ解析 - 本/データ解析のための統計モデリング入門

    講義のーと の内容を詳しく説明したものです 著者: 久保拓弥 出版社: 岩波書店, シリーズ「確率と情報の科学」 編集: 甘利俊一,麻生英樹,伊庭幸人 このペイジの省略 URL: http://goo.gl/Ufq2 刊行と まちがい・修正一覧) 第 1 刷刊行: 2012 年 5 月 18 日 第 15 刷刊行: 2018 年 3 月 15 日 原稿時点の PDF ファイル (参考用) 目次, さくいん, まえがき 韓国語版 (翻訳は滋賀大の李鍾賛さん, 2017-09-15) 「統計モデリング入門」ネット上のあれこれ (のごく一部) 丸善・ジュンク堂書店の「今年驚いた! 1 冊」の「驚きの出版賞」 に選ばれました! (web archive, KuboLog 2012-12-20) Amazon カスタマーレビュー はてな出版物 -- 言及ブログへのリンクなどがあります! ブクログ,

  • OPEN METI

    経済産業省が保有する多様なデータ。そこには、あらゆるテーマにわたって日経済の過去と現在が記録されている。OPEN METIプロジェクトは、これらの膨大なデータを様々な切り口で紐解き、活用可能なオープン・データとして公開していくプロジェクトです。経済産業省が保有する多様なデータ。 そこには、あらゆるテーマにわたって 日経済の過去と現在が記録されている。 OPEN METIプロジェクトは、 これらの膨大なデータを様々な切り口で紐解き、 活用可能なオープン・データとして 公開していくプロジェクトです。 経済産業省 〒100-8901 東京都千代田区霞が関1-3-1 代表電話 03-3501-1511 Copyright Ministry of Economy, Trade and Industry. All Rights Reserved. Supported by rhizomatiks

  • 統計的機械学習入門 | 中川研究室

    導入pdf 情報の変換過程のモデル化 ベイズ統計の意義 識別モデルと生成モデル 最尤推定、MAP推定 データの性質 情報理論の諸概念 (KL-divergenceなど) 距離あるいは類似度 数学のおさらいpdf 行列の微分 線形代数学の役立つ公式 多次元正規分布 条件付き正規分布 Bayes推論pdf Bayseによる確率分布推定の考え方 多項分布、ディリクレ分布 事前分布としてのディリクレ分布の意味<\li> 正規分布と事後分布 指数型分布族 自然共役事前分布の最尤推定 線形回帰および識別pdf 線形回帰のモデル 正則化項の導入 L2正則化 L1正則化 正則化項のBayes的解釈 線形識別 2乗誤差最小化の線形識別の問題点 生成モデルを利用した識別 学習データと予測性能pdf 過学習 損失関数と Bias,Variance, Noise K-Nearest Neighbor法への応用 b

  • 統計ソフトRの「困った」を解決する12(+α)の方法|Colorless Green Ideas

    はじめに Rの「困った」 現在、統計処理ではRというソフトがよく使われている。Rは高機能であり、初心者から上級者まで使うことができる。とは言っても、Rに取りかかるのはなかなか難しい。テレビ洗濯機といった家電製品を買ったならば、紙の説明書が付いてくるので、とりあえずそれを見れば、最初の使い方も分かるし、困ったときにどうすれば良いか分かる。Rのようなソフトウェアではそうはいかない。「困った」を解決してくれる紙の虎の巻 [1] は付いてこない。また、メーカーのサポートが付いた商品なら、メーカーに問い合わせるという手段もあるが、フリーソフトのRではそうもいかない。 結局、Rで何か「困った」ことが起きた場合、自分で色々と調べなくてはならない。こう言うと、Rは大変そうだと思う人もいるかもしれない。だが、主にインターネットを通じて、Rの説明書代わりのさまざまな情報が提供されている。 この記事では、「コ

  • エンジニアのためのデータ可視化実践入門という本を書いた - あんちべ!

    2014/10/14 追記 書87ページに「母数」という単語が複数回出てきますが、 これは全て「分母」とすべきでした。*1 通常、統計学の文脈では、母数は各確率分布を特徴付ける変数を指す単語であり、 例えば正規分布は平均と分散という二つの母数によって形状が決定されます。 決して母数と分母(あるいは全数)と誤解してはなりません。 しかし母数と分母を混同することは当によくあることで、 書はこのような頻出する誤解を訂正し、 皆様が統計を用いる際の失敗を一つでも減らす という目的で執筆に至ったにも拘らず、 まさか書でこのような重大な失敗をしてしまったことに対し 心からお詫び申し上げ訂正させて頂きます。 なお、問題個所の記述は共著者の森藤氏ではなく 私が記述したものであり、全責任は私にあります。 を書くに当たり、誤字脱字や言い回しの不備は出来る限り無くすべきですが、 人間であるためミスをす

    エンジニアのためのデータ可視化実践入門という本を書いた - あんちべ!
  • おしゃべりな部屋 (プラネタリウム,星,植物,熱帯魚,統計学)

    アクセスしていただき,ありがとうございます。 このページへのアクセスは,通算 6302456 回目です。 (1995年8月31日 からカウント開始) フォト蔵ふ つれづれなるままに ときどき一枚 狛犬ギャラリー 道祖神ギャラリー

  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ

  • 統計学自習ノート

    多変量解析 回帰分析(あてはめ),判別分析,主成分分析,因子分析, SEM 数量化 I 類,数量化 II 類,数量化 III 類,数量化 IV 類 正準相関分析,クラスター分析,主座標分析 クロンバックの $\alpha$ 信頼性係数 生存率解析 Cutler-Ederer 法による生命表,Kaplan-Meier 法による生命表 多重ロジスティックモデル,Cox の比例ハザードモデル

  • 東京工業大学 情報理工学院 数理・計算科学系

    大岡山地区の建物 大学正門より,桜並木のウッドデッキを通り,右手の芝生をつっきる小径が西8号館,西7号館に続くみちです. 大岡山西8号館(E棟,W棟): キャンパスマップの18, 19番の建物にあたります.館の西隣りに位置しています.正面玄関をはいったところは3階です. E棟においでの方は廊下をはいってすぐ左手のエレベータをご利用下さい. W棟にはじめておいでの方は十分に注意して下さい.E棟とW棟を繋いでいる通路は3階と10階にしかありません.E棟のエレベータを利用すると迷子になります.正面玄関から廊下をまっすぐにおいでになり,奥の右手にあるエレベータをご利用下さい. 西7号館:キャンパスマップの17番の建物にあたります.西8号館から,建物を二つ挟んだ並びにあります.芝生から向う場合,左手に館を見ながら進み,館がとぎれたあたりの右手にある小さな建物が西7号館です.橋を渡ってはいったと

  • Rやりはじめました (CodeZine編集部ブログ)

    とあるデータマイニング勉強会にいったのですが、いまさらというか遅すぎだとおもうのですが、Rのすばらしさに気づいて、やりはじめました。豊富なライブラリで、いろんなことがすごく簡単にできて、図で表現して理解できるところが楽しいです。 実際に、この資料を基にやってみます。 統計的テキスト解析(6)~語のネットワーク分析~ http://mjin.doshisha.ac.jp/R/61/61.html 菅首相の信表明演説をグラフ化してみます。 第174回国会における菅内閣総理大臣所信表明演説 http://www.kantei.go.jp/jp/kan/statement/201006/11syosin.html ライブラリを読み込んで、 library(igraph) ibrary(RMeCab) 形態素解析で名詞だけにします。 kekkaDF <- NgramDF("kan.txt", t