Fuyu76のブックマーク / 2020年2月9日

Fuyu76 id:Fuyu76

2020年2月9日のブックマーク (2件)

ベイズ統計 - HELLO CYBERNETICS
はじめにデータとモデル確率モデル確率モデルを作る複雑なモデルを使うことが最善手であるかモデルの具体的な作り方モデルの仮定アンサンブルモデル点推定モデル最尤推定制約付き最尤推定※ （最大事後確率推定）ベイズ予測分布と点推定ベイズ統計学ベイズ予測分布を得ることの意義ベイズ統計学の主題特異モデルと正則モデルベイズ統計学のまとめはじめにベイズだの頻度論だので盛り上がっているので、ぶん殴られる覚悟で書いてみます。データとモデル観測値がランダムに見える場合、それを確率変数 $X$ として扱います。さて、今、$X$ には我々が知ることのできない真の分布 $q(X)$ があるとしましょう。もしも、$X$ を無限回観測し満遍なくデータを集められるとすれば、$q(X)$ の形状を把握することができるかもしれません。ところが、そんなのは幻想であって実際に無限回の観測を
Fuyu76 2020/02/09
機械学習

ベイズ
リンク
ハイパラ管理のすすめ -ハイパーパラメータをHydra+MLflowで管理しよう- - やむやむもやむなし
機械学習をやっている人なら誰もが遭遇したであろうこの光景 (※写真はPyTorchのLanguage ModelのExampleより) Pythonのargparseでシェルから引数を受け取りPythonスクリプト内でパラメータに設定するパターンは、記述が長くなりがちな上、どのパラメータがmodel/preprocess/optimizerのものなのか区別がつきにくく見通しが悪いといった課題があります。私は実験用のパラメータ類は全てYAMLに記述して管理しています。 YAMLで記述することでパラメータを階層立てて構造的に記述することができ、パラメータの見通しがぐっとよくなります。 preprocess: min_df: 3 max_df: 1 replace_pattern: \d+ model: hidden_size: 256 dropout: 0.1 optimizer: algo
Fuyu76 2020/02/09
機械学習
リンク
- 2020年2月11日
- 2020年2月9日
- 2020年1月19日