[B! stats] horihorioのブックマーク

untitled

1 12 H-J ) ( ) ( t E x p i t x k i e e − − = = h ω ϕ ) , ( ) , ( ) , ( 2 ) , ( 2 2 2 t x t x U x t x m t t x i ψ ψ ψ + ∂ ∂ − = ∂ ∂ h h x i p ∂ ∂ − = h m P E 2 2 = ϕ ϕ h ip x = ∂ ∂ ϕ ϕ h iE t − = ∂ ∂ x i p ∂ ∂ − = h h i px xp = − t i E ∂ ∂ = h h i tE Et = − t i E ∂ ∂ = h m P E 2 2 = 2 2 ) , ( 2 ) , ( x t x m i t t x ∂ ∂ = ∂ ∂ ψ ψ h 2 2 ) , ( ) , ( x t x P D t x P t ∂ ∂ = ∂ ∂ ) ( 2 σ = ∆ = ∆ t D x t

horihorio 2017/09/29

リンク

重回帰のときに必要なデータの数はパラメータの数の10倍です - 驚異のアニヲタ社会復帰の予備

読んだ。 J Clin Epidemiol. 1995 Dec;48(12):1503-10. パラメータ数がのデータを標本数個観測して重回帰なりなんらかの回帰分析を行うのだが、「標本数はいくつあったらいいんですか?」と聞かれることが多々ある。そういうとき、パラメータの10倍(10)あったらいいんじゃないっすかね〜(適当と答えることが多いのだが、パラメータ数に対する標本数の割合(EPV, event per variables)が10 ならいいんじゃないっすかね(適当と言っている論文。論文中では673人の患者に対して7つのパラメータが測定されていて、252件の死亡についてCox 回帰を行うが、データセットをすべて使えば252/7 = 36 EPV のところを、2, 5, 10, 15, 20 とEPV の割合を変えてデータセットをリサンプリングしてCox 回帰を繰り返し、パラメー

horihorio 2016/09/28

R
stats

リンク

Ultimate Guide for Data Exploration in Python using NumPy, Matplotlib and Pandas

Ultimate Guide for Data Exploration in Python using NumPy, Matplotlib and Pandas Introduction Data exploration sets and developing a deep understanding of the data is one of the most important skills every data scientist should possess. People sometimes estimate that the time spent on these activities can go as high as 80% of the project time. Python has been gaining much ground as a preferred too

horihorio 2015/12/03

リンク

https://www.integrate.io/

horihorio 2015/04/11

リンク

オンラインで無料で読める統計書22冊｜Colorless Green Ideas

はじめに今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれた本が多いが、日本語で書かれた本も若干ある。入門書まず、統計の初学者のために書かれた入門書を紹介したいと思う。福井正康 (2002). 『基礎からの統計学』基礎から扱っている統計の入門書である。統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。理解を助けるための演習問題とその解答がついている。統計処理用のソフトとしてはExcelを使っている。同じサイトに社会科学系の学生向けの数学の教科書もある。小波秀雄 (2013). 『統計学入門』基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論

horihorio 2014/10/22

book
stats

リンク

Regression-Discontinuity Analysis

Regression-Discontinuity AnalysisAnalysis RequirementsThe basic RD Design is a two-group pretest-posttest model as indicated in the design notation. As in other versions of this design structure (e.g. the Analysis of Covariance Randomized Experiment, the Nonequivalent Groups Design), we will need a statistical model that includes a term for the pretest, one for the posttest, and a dummy-coded vari

horihorio 2014/10/20

リンク

http://www.vision.cs.chubu.ac.jp/flabresearcharchive/bachelor/B11/Paper/mishina.pdf

horihorio 2013/08/22

stats

リンク

生物統計入門

製薬会社・CROの解析担当などの勉強会での配布資料です。ある程度初歩的なところから解説している資料が多いです。なお、資料中のデータは全て架空のものです。（データのプロットと要約統計量）データのプロットと要約について (2011年4月5日に修正しました) （確率分布と基本的な検定）正規分布・t分布・χ^2分布・F分布について（分散分析の資料と同じものです） t検定について (Armitage勉強会第２回資料です) 二項分布からPoisson分布の導出 (計算特訓の資料と同じものです) 二項分布とPoisson分布の平均・分散 (計算特訓の資料と同じものです) 高校生にも分かる超幾何分布 (計算特訓の資料と同じものです) Fisher's exact testについて (計算特訓の資料と同じものです) 超幾何分布の平均・分散・共分散 (平成23年度第１回BioS継続勉強会補助資

horihorio 2012/12/24

math
stats

リンク

K-meansアルゴリズムの導出 - nokunoの日記

引き続き東大の「創造情報学連携講義VII」より栗原さんの課題2を解きました。創造情報学連携講座問題個のデータをk個のクラスタにクラスタリングしたい。このとき番目のクラスタの中心をとして、minimize: となるような各データからクラスタへの割り当てとクラスタ中心を求めるためのアルゴリズムとして以下のk-meansクラスタリングが導出できることを示せ。クラスタ中心をランダムに初期化する収束するまで以下を繰り返すステップ1：それぞれのデータ点に最も中心が近いクラスタを割り当てるステップ2：それぞれのクラスタの中心をクラスタ内のデータ点の平均によって計算する回答ステップ1ステップ1では、を固定してを更新する。minimize: for all これの最小化は全てのに対し、データ点に最も中心が近いクラスタを割り当てることで達成される。minimize: for all iよって

horihorio 2011/07/04

リンク

はてなブックマーク

タグ

関連タグで絞り込む (12)

statsに関するhorihorioのブックマーク (9)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス