[B! モンテカルロ法] koma_gのブックマーク

koma_g id:koma_g

モンテカルロ法に関するkoma_gのブックマーク (2)

エレガントな解法、エレファントな解法〜モンテカルロ法を添えて〜｜山本一成🚗TURING
問コインを100回投げて、表か裏が10回連続で出る確率は？皆さんこの問題解けますでしょうか？私は正直解ける気がしません。そもそも何％くらいなのかすら、うまく推測できません。今日は、しかし皆さんには全然別の方法論を共有できればと思います。その方法論とはずばり実際に投げてみましょう。「コインを100回投げて、表か裏が10回連続で出るかどうか」を100回あるいは1000回くらい試行してみたらそれなりに正しい確率が出ると思いませんか？実際にでます。でもいくらなんでも現実にするのはつらいですよね。そこでせっかくなのでコンピュータに投げさせましょう。といっても実際に投げるのではなく、コンピュータの中で乱数（ランダム）を発生させて、それで投げていることにしましょう。プログラムで書くとこんな感じです。コインを100回投げて、表か裏が10回連続で出るかどうか調べるプログラム。試行回数が増えるほどに
koma_g 2018/02/04
モンテカルロ法

考え方
リンク
【強化学習初心者向け】シンプルな実装例で学ぶSARSA法およびモンテカルロ法【CartPoleで棒立て：1ファイルで完結】 - Qiita
【強化学習初心者向け】シンプルな実装例で学ぶSARSA法およびモンテカルロ法【CartPoleで棒立て：1ファイルで完結】Python 機械学習強化学習 ※2018年06月23日追記 PyTorchを使用した最新版の内容を次の書籍にまとめました。つくりながら学ぶ! 深層強化学習 ~PyTorchによる実践プログラミング~ 18年6月28日発売強化学習の代表的な手法である「SARSA法」と「モンテカルロ法」の、実装コード紹介と解説を行います学習する対象には、強化学習の「Hello World！」的存在である「CartPole」を使用します。概要強化学習の代表的な手法であるSARSA法、モンテカルロ法の2通りを実装・解説します。 ※ディープラーニングは使用しません。古典的？な強化学習です。・どちらも150行程度の短いプログラムです・外部の強化学習ライブラリなどを使用せず、自力で組ん
koma_g 2017/12/20
あとで読む

機械学習

強化学習

python

SARSA

モンテカルロ法
リンク
1