タグ

統計学に関するmahler-5のブックマーク (48)

  • 分散共分散行列 - 大人になってからの再学習

    まずは復習。 分散とは「各データが平均値からどれだけ離れているか」という、データの散らばり具合を表す。 具体的には、分散は「(各データの平均値からの距離)の2乗の平均」。 分散は2乗であることに注意。単位をそろえるために、分散の平方根を取ったものが標準偏差。 標準偏差をσで表すと、分散はσ^2で表される。 式で表すと次のようになる。 ここで、次のようなベクトルを導入する。(なぜ? あとで値を複数持つデータに拡張するのに便利だから) すると、さきほどの分散の式は、次のような縦ベクトルと横ベクトルの積の形で書くことができる。 (’は転置を表す) これまでの話で、たとえば、数学のテストの点数がどれくら散らばっているか、ということを知ることができる。 ここで、英語のテストも行った場合、数学英語の点数の関係を知りたい、という場合には、複数のデータ群を扱う必要がある。 例えば、生徒の「数学の点数」と

  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ

  • biunit

    農学生命情報科学特論 I @東京大学アグリバイオインフォマティクス教育研究ユニット (2023-10) プログラミング言語未経験者を対象とした Python 入門講義。農学や分子生物学などの分野で利用される Python の最新事例を紹介しながら、Python の基礎文法の講義を行う。

  • やくみ堂~砂漠から徒歩3分~

  • ポアソン分布と指数分布<確率・統計<Web教材<木暮

    キーワード 確率分布、ポアソン分布、指数分布 参照:JavaScriptの計算プログラム 数多くの部品のどれかが故障する、スーパーのレジに客がくるというような場合を考えます。1日、1分間などの単位時間にそれらの事象が起こる回数は、平均的にはわかっていますが、個々の故障や客がいつくるかはわかりません。たとえば、客の平均到着率が1時間に10人だと統計的にはわかっていても、15人の場合もあるし、5人の場合もあります。 ここで、次の仮定をします。この3つの仮定を満足するということは、客の来かたは「でたらめ」だということです。それをランダムだといいます。 独立性 ある事象が次に起こる確率は、これまでの経過に関係しない。 先に大勢来たから次はあまり来ないだろうということはないとします。 定常性 ある事象が起こる確率は、対象とする期間中は一定である。 スーパーなどでは、時間帯により客の数は異なりますが、

    ポアソン分布と指数分布<確率・統計<Web教材<木暮
  • techdmba - 確率変数-種々の分布の特徴

    確率変数に関する理解は、ビジネスにおいて重要である。特に、統計学は、経済学の理解を助け、ビジネスでは研究開発や品質管理はもちろんのこと、マーケティングにおいても必須である。数学的な概念がなければ、「あるパフォーマンスが5%向上した」ことが、偶然なのか、有意なのかで、その後の行動様式が大きく変わる。結局、最後の決め手になるのは、”数字”なのである。 ページでは、分布の特徴とともに、下に参考書籍を記載している(ページの記載はページ下の書籍を参考している)。 *図の形状はイメージです。 ページでの記載内容-正規分布、一様分布、三角分布、二項分布、ポアソン分布、幾何分布、超幾何分布、対数正規分布、指数分布、ワイブル分布、ベータ分布など。ページ下に参考書籍。 正規分布) 身長、体重などの自然現象を示すもので、確率理論の中では最も重要な連続分布。平均値以上と以下の値をとる確率は同じで、平均値に近

  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.