「期待値の関数」の1/Nバイアス、知ってる人には常識なんだろうけど、初めて知った時は「へー」ってなった。 https://t.co/kf7HNgr7ZZ
はじめに データ分析:実用系 Kaggleで勝つデータ分析の技術 ウェブ最適化ではじめる機械学習 データ分析:因果推論 入門 統計的因果推論 計量経済学 大人の教養 世界標準の経営理論 科学的に正しい筋トレ 最強の教科書 落合務のパーフェクトレシピ はじめに 今回は、特にドメインを指定せず、読むと間違いなく誰にでも勉強になるであろうと感じた書籍を紹介します。 データ分析:実用系 Kaggleで勝つデータ分析の技術 Kaggleで勝つデータ分析の技術 作者:門脇 大輔,阪田 隆司,保坂 桂佑,平松 雄司発売日: 2019/10/09メディア: 単行本(ソフトカバー) "Kaggleで勝つ"と題名にはありますが、データ分析、特に予測モデルを作るようなケースで重要な基礎知識が実践的に学ぶことができる非常に良い本となっています。例えば、交差検証といえば、基本的には汎化誤差の推定量として統計学の本に
東京大学・株式会社Nospareの菅澤です. 今回はベイズ統計学を勉強する上で個人的にオススメな日本語の教科書10冊を簡単に紹介したいと思います. 一般的な方法論・基礎理論 中妻照雄『入門ベイズ統計学』 簡単な例と実践的な例を使ってベイズ推論の考え方が導入された後,マルコフ連鎖モンテカルロ法(MCMC)の基礎的な事項がまとめられています.基本的な数理統計学が理解できていれば十分読める内容になっている印象です.この本の続編である中妻照雄『実践ベイズ統計学』では,ファクターモデルやそのポートフォリオ選択への応用,ベイズ的線形回帰モデル,モデル平均化法などのより発展した内容について丁寧に解説されています. 伊庭幸人・種村正美・大森裕浩・和合肇・佐藤整尚・高橋明彦『計算統計II』 かなりボリュームのある内容の本です.基本的な話題として,MCMCの基礎や標準的な統計モデルにおけるベイズ推論に関して数
はじめに 千葉大学・株式会社Nospareの川久保です. 今回は,初学者レベルから学部上級レベルの統計学関連の教科書を,順を追って紹介していきます.普段,経済学をはじめとする社会科学(経済学・経営学や政治学など)を学ぶ学生に教えているので,タイトルに「社会科学向き」と入れてみましたが,これから紹介する多くの本は,他の応用でも役に立つものが多いはずです. 入門書 大屋幸輔『コア・テキスト統計学』 厳密さと初学者に対する分かりやすさのバランスのとれた本です.演習問題を集めた副読本もあるので,こちらと併せて学習すると効果的だと思います. 久保川達也・国友直人『統計学』 入門書としては,やや硬派な教科書ですが,しっかり学びたい人にはお勧めの教科書です.「1.記述統計」「2.確率」「3.推測統計」と標準的な構成をしている中,最後の第4部では社会・経済データとして標本調査や時系列分析の話題にも触れてい
不偏推定量とは統計的推定には様々な手法がありますが、中でもよく用いられるのが、普遍性という基準に基づいた推定です。普遍性とは、推定量の期待値が母数と等しくなる性質であり、母数θθθの推定量をθ^\hat{θ}θ^と表すと、 E(θ^)=θE(\hat{θ}) = θE(θ^)=θ を満たすようなものです。また、この時の推定量θ^\hat{θ}θ^を不偏推定量と言います。これは点推定の一種です。 平均と分散の不偏推定量例として、無作為標本x1,x2,...,xnx_1,x_2,...,x_nx1,x2,...,xnから推定できる、母集団の平均μμμと分散σ2σ^2σ2の不偏推定量を考えてみます。 平均の不偏推定量標本平均をxˉ\bar{x}xˉとすると、 E(xˉ)=E(1n∑i=1n xi)=1n∑i=1n E(xi)=1n×nμ=μE(\bar{x}) = E(\frac{1}{n
はじめに: 統計学の重要性 NTT データ数理システムでリサーチャーをしている大槻 (通称、けんちょん) です。 今回は統計検定 1 級について記します。 統計検定とは日本統計学会による公認の資格であり、統計に関する知識や活用力を評価するものです。 日常的に大量のデータが溢れている昨今、データ分析や機械学習に対するニーズは最高の高まりを見せています。最近では何も考えずともただデータを入力するだけでデータ分析や機械学習手法を実行してくれるツールも多数出回るようになりました。 データ分析や機械学習を実際に遂行するにあたって、統計学は強力な基礎になります。確かに最近は便利なツールの発達のおかげで、統計を学ばずともデータ分析を実行できる環境が整いつつありますが、その状態でデータ分析手法や機械学習手法を実際に適用しようとすると、しばしば誤った推論をしてしまったり、複雑な状況に対してどのようなアプロー
はじめに 千葉大学/Nospareの米倉です.今回は僕が専門にしている計算機統計学・ベイズ統計学周辺で僕が勝手にお勧めだと思う教科書を10冊簡単なコメント付きで紹介したいと思います.初学者向けといより,修士・博士課程位のレベルのが多いので,ややプロ向けです. お勧めのプログラミング言語 僕は普段Julia言語を用いています.特徴は非常に高速なのと,可読性の高さでしょうか.個人的にはPythonやRより優れていると感じていて,僕の周りの専門家でも使っている人が多いです. Robert and Casella "Monte Carlo Statistical Methods" この分野のバイブルと言えばバイブルみたいな感じですが,そう呼ぶにはちょっと頼りない感じもします.けどモンテカルロ法に興味がある人はマストバイです.色々な種類のモンテカルロ法が網羅的に紹介されています. Efron and
先日ですが、旧知の*1Grahamianさんのこんなツイートが話題になっていました。 データ分析をするときシンプルに重要なことは「生のデータを眺める」と「データの分布をグラフにする」ことなんじゃないかと思うんですよね。すぐにクロスとかファネルとかコホートとかやりたくなるんですけど、まずは目の前のデータがどんなものか頭にマッピングさせることが長期的に効いてくる感じ。— Grahamian📊データ分析と機械学習 (@grahamian2317) 2021年1月12日 何を当たり前のことを言っているんだと眉を顰める向きもあるかもしれませんが、これだけデータサイエンスやら機械学習(人工知能)やらが喧伝されている昨今においては、少なからぬ現場で「データはどこかのAPIからバルクでダウンロードしてくるor本番DBから転送してくるだけ」「やってきたデータは中身を見もせずにそのまま統計分析や機械学習など
こんな本出てて無料公開されてるの今の今まで知らんかった。。 https://t.co/18tloeoSih https://t.co/lVH0lzgRDk
前回「ベイズ統計学に関する議論を整理する」では、できるだけ中立的な視点で書くことに注力し、伊津野なりの結論については特に書かなかった。今回のエントリでは、様々な見解や調べた結果を元に私見を書く。 もちろん、伊津野は専門家ではなく、情報や理解が不足する部分については想像で補ったため「それはおかしい」と感じられる点もあるだろう。そのような記述を見つけたら、単に批判を書くのではなく、なぜ問題だと思うのか、自身のブログやTwitterなどで他の人間にも理解できるように論点を明確に書くようにしてほしい。うんこの投げ合いはうんざりだ。それに、コメント欄に批判や反論を書かれても、伊津野の理解力では適切な回答ができるとは思えない。広い範囲に意見を投げかけた方がより専門的な回答が得られ生産的だろう。*1 前置きが長くなったので本論に移ろう。 まず先に結論を述べる。現在、ベイズ統計学は「(頻度主義とは異なる)
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く