タグ

ブックマーク / qiita.com/s-yonekura (4)

  • 決定係数について - Qiita

    はじめに 千葉大学/Nospareの米倉です.今回は決定係数について解説したいと思います. 決定係数とは まずは次のような線形回帰モデルを考えます, $$y=X\beta+\epsilon.$$ ここで$y,X,\beta$はそれぞれ,$n$次元の被説明変数のベクトル,$X$は説明変数ベクトルからなる$n\times d$の行列,$\beta$は$d$次元のパラメータのベクトルとし,$\epsilon$は線形回帰分析の際の適当な仮定を満たす確率ベクトル(誤差ベクトル)とし,その分散は$\sigma^2$であるとします.またこの記事では$X$も確率変数だとしますが,定数として扱っても議論の結論などに影響はないです. この時,最小二乗推定量$\hat{\beta}$は,$$\hat{\beta}=(X^{\top}X)^{-1}X^{\top}y$$と適当な仮定の下で求まります.これを用いると

    決定係数について - Qiita
    misshiki
    misshiki 2022/01/31
    “現代の統計学を用いた実証分析では決定係数を報告する意味はない...決定係数の代わりに,例えばleave-one-out cross-validation (LOOCV,一個抜き交差検証) を用いたモデルの当てはまりの診断がメジャーになってきています.”
  • ノンパラメトリックな方法を用いた探索的データ分析 - Qiita

    はじめに 千葉大学/Nospareの米倉です.今回はノンパラメトリックな方法(分析で用いる分布を仮定しない)を用いた,探索的データ分析について解説します.ノンパラメトリックな方法を用いることにより,モデルの特定化の失敗の影響を抑えたり,またパラメトリックな方法を用いる際の予備的分析になると思います.また簡単なA/Bテストにもいいのかなと思います. Empirical Cumulative Distribution Function(ECDF) Empirical Cumulative Distribution Function(ECDF)とは,累積分布関数を経験分布を用いて推定(データから推定)したものです.確率変数$X$が$x$以下になる確率$P(X\leq x)$を累積分布関数といいます.これをデータから推定したものがECDFです.推定方法は簡単で,例えば次のJuliaのコードではso

    ノンパラメトリックな方法を用いた探索的データ分析 - Qiita
  • 無料で読める統計学・機械学習周辺のチュートリアル論文や講義ノート10本 - Qiita

    はじめに 千葉大学/Nospareの米倉です.今回は,統計学・機械学習周辺で,僕が良いと思ったチュートリアル/サーベイ論文と講義ノートを簡単なコメント付きで紹介したいと思います.チュートリアル論文やサーベイ論文は,そのトピックの解説や教育面にフォーカスしていて,何か勉強したり,網羅的に把握するときに非常に便利だと個人的に思います.また公開されている講義ノートの中には非常に勉強になるものが多くあります.内容は僕が興味があるトピックに偏っています.またすべて無料で読めます.(教科書等の海賊版みたいなのは載せていません) 10の紹介 Nickl "STATISTICAL THEORY" Nicklの統計学の講義ノートです.いわゆるM推定量の漸近的性質に加え,バーンスタイン・フォンミーゼズ定理等も証明付きで解説されており,上級レベルの数理統計学を学ぶのに重宝すると思います. Doucet and

    無料で読める統計学・機械学習周辺のチュートリアル論文や講義ノート10本 - Qiita
    misshiki
    misshiki 2021/01/25
    “統計学・機械学習周辺で,僕が良いと思ったチュートリアル/サーベイ論文と講義ノートを簡単なコメント付きで紹介”無料。
  • 計算機統計学・ベイズ統計学周辺でのお勧めの教科書10冊 - Qiita

    はじめに 千葉大学/Nospareの米倉です.今回は僕が専門にしている計算機統計学・ベイズ統計学周辺で僕が勝手にお勧めだと思う教科書を10冊簡単なコメント付きで紹介したいと思います.初学者向けといより,修士・博士課程位のレベルのが多いので,ややプロ向けです. お勧めのプログラミング言語 僕は普段Julia言語を用いています.特徴は非常に高速なのと,可読性の高さでしょうか.個人的にはPythonやRより優れていると感じていて,僕の周りの専門家でも使っている人が多いです. Robert and Casella "Monte Carlo Statistical Methods" この分野のバイブルと言えばバイブルみたいな感じですが,そう呼ぶにはちょっと頼りない感じもします.けどモンテカルロ法に興味がある人はマストバイです.色々な種類のモンテカルロ法が網羅的に紹介されています. Efron and

    計算機統計学・ベイズ統計学周辺でのお勧めの教科書10冊 - Qiita
    misshiki
    misshiki 2021/01/25
    “計算機統計学・ベイズ統計学周辺で僕が勝手にお勧めだと思う教科書を10冊簡単なコメント付きで紹介...初学者向けといより,修士・博士課程位のレベルのが多いので,ややプロ向けです.”
  • 1