タグ

statsに関するhorihorioのブックマーク (9)

  • untitled

    1 12 H-J ) ( ) ( t E x p i t x k i e e − − = = h ω ϕ ) , ( ) , ( ) , ( 2 ) , ( 2 2 2 t x t x U x t x m t t x i ψ ψ ψ + ∂ ∂ − = ∂ ∂ h h x i p ∂ ∂ − = h m P E 2 2 = ϕ ϕ h ip x = ∂ ∂ ϕ ϕ h iE t − = ∂ ∂ x i p ∂ ∂ − = h h i px xp = − t i E ∂ ∂ = h h i tE Et = − t i E ∂ ∂ = h m P E 2 2 = 2 2 ) , ( 2 ) , ( x t x m i t t x ∂ ∂ = ∂ ∂ ψ ψ h 2 2 ) , ( ) , ( x t x P D t x P t ∂ ∂ = ∂ ∂ ) ( 2 σ = ∆ = ∆ t D x t

  • 重回帰のときに必要なデータの数はパラメータの数の10倍です - 驚異のアニヲタ社会復帰の予備

    読んだ。 J Clin Epidemiol. 1995 Dec;48(12):1503-10. パラメータ数が のデータを標数 個観測して重回帰なりなんらかの回帰分析を行うのだが、「標数はいくつあったらいいんですか?」と聞かれることが多々ある。そういうとき、パラメータの10倍(10)あったらいいんじゃないっすかね〜(適当 と答えることが多いのだが、パラメータ数に対する標数の割合(EPV, event per variables)が10 ならいいんじゃないっすかね(適当 と言っている論文。 論文中では673人の患者に対して7つのパラメータが測定されていて、252件の死亡についてCox 回帰を行うが、データセットをすべて使えば252/7 = 36 EPV のところを、2, 5, 10, 15, 20 とEPV の割合を変えてデータセットをリサンプリングしてCox 回帰を繰り返し、パラメー

    重回帰のときに必要なデータの数はパラメータの数の10倍です - 驚異のアニヲタ社会復帰の予備
  • Ultimate Guide for Data Exploration in Python using NumPy, Matplotlib and Pandas

    Ultimate Guide for Data Exploration in Python using NumPy, Matplotlib and Pandas Introduction Data exploration sets and developing a deep understanding of the data is one of the most important skills every data scientist should possess. People sometimes estimate that the time spent on these activities can go as high as 80% of the project time. Python has been gaining much ground as a preferred too

    Ultimate Guide for Data Exploration in Python using NumPy, Matplotlib and Pandas
  • https://www.integrate.io/

  • オンラインで無料で読める統計書22冊|Colorless Green Ideas

    はじめに 今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれたが多いが、日語で書かれたも若干ある。 入門書 まず、統計の初学者のために書かれた入門書を紹介したいと思う。 福井正康 (2002). 『基礎からの統計学』基礎から扱っている統計の入門書である。統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。理解を助けるための演習問題とその解答がついている。統計処理用のソフトとしてはExcelを使っている。同じサイトに社会科学系の学生向けの数学の教科書もある。 小波秀雄 (2013). 『統計学入門』基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論

    オンラインで無料で読める統計書22冊|Colorless Green Ideas
  • Regression-Discontinuity Analysis

    Regression-Discontinuity AnalysisAnalysis RequirementsThe basic RD Design is a two-group pretest-posttest model as indicated in the design notation. As in other versions of this design structure (e.g. the Analysis of Covariance Randomized Experiment, the Nonequivalent Groups Design), we will need a statistical model that includes a term for the pretest, one for the posttest, and a dummy-coded vari

  • http://www.vision.cs.chubu.ac.jp/flabresearcharchive/bachelor/B11/Paper/mishina.pdf

  • 生物統計入門

    製薬会社・CROの解析担当などの勉強会での配布資料です。 ある程度初歩的なところから解説している資料が多いです。 なお、資料中のデータは全て架空のものです。 (データのプロットと要約統計量) データのプロットと要約について (2011年4月5日に修正しました) (確率分布と基的な検定) 正規分布・t分布・χ^2分布・F分布について (分散分析の資料と同じものです) t検定について (Armitage勉強会 第2回資料です) 二項分布からPoisson分布の導出 (計算特訓の資料と同じものです) 二項分布とPoisson分布の平均・分散 (計算特訓の資料と同じものです) 高校生にも分かる超幾何分布 (計算特訓の資料と同じものです) Fisher's exact testについて (計算特訓の資料と同じものです) 超幾何分布の平均・分散・共分散 (平成23年度 第1回BioS継続勉強会補助資

  • K-meansアルゴリズムの導出 - nokunoの日記

    引き続き東大の「創造情報学連携講義VII」より栗原さんの課題2を解きました。創造情報学連携講座 問題個のデータをk個のクラスタにクラスタリングしたい。このとき番目のクラスタの中心をとして、minimize: となるような各データからクラスタへの割り当てとクラスタ中心を求めるためのアルゴリズムとして以下のk-meansクラスタリングが導出できることを示せ。 クラスタ中心をランダムに初期化する 収束するまで以下を繰り返す ステップ1:それぞれのデータ点に最も中心が近いクラスタを割り当てる ステップ2:それぞれのクラスタの中心をクラスタ内のデータ点の平均によって計算する 回答 ステップ1ステップ1では、 を固定して を更新する。minimize: for all これの最小化は全てのに対し、データ点に最も中心が近いクラスタを割り当てることで達成される。minimize: for all iよって

  • 1