Syunpeiのブックマーク - はてなブックマーク

強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS
はじめにベルマン方程式の概要最適制御と評価関数最適制御評価関数価値関数ベルマンの最適性原理ベルマン方程式価値関数の離散化状態の時間発展再訪ベルマン方程式まとめ最後にはじめに強化学習の基礎に置かれている「ベルマン方程式」について、言葉は知っているが実はちゃんと理解していないという方は意外と多いのではないかと思われます。これを知っていようが知っていまいが、正直世の中の便利なフレームワークを活用すれば強化学習を実行することは可能であるためだと推測されます。しかし、ある種の出発点になっているはずの基礎方程式を無視して、ガチャガチャ色々試してみても、なんだかフワついたままでモヤモヤしてしまうのではないでしょうか。少なくとも自分はそうです。なので今回はベルマン方程式を基本から丁寧に解説していきたいと思います。ベルマン方程式の概要細かい話をする前に、ベルマン方程式がど
Syunpei 2019/09/24
機械学習

techfeed

あとで読む
リンク
機械学習を学ぶ上で抑えておきたい数学２ - HELLO CYBERNETICS
機械学習や深層学習を学ぶ上で、数学は言語である線形代数学行列とベクトルは連立方程式を解くための記法機械学習での活躍どこまで学ぶか最適化数学学習とは教師あり学習教師なし学習最適化を行う際の重要ワード「正則化」どこまで学ぶ必要があるか確率・統計最低限知っておくべき定理や性質最低限知っておくべき推定法確率分布には見慣れるしかない何に役立つのか情報理論情報を確率で記述する何に役立つのか情報幾何学発祥は日本機械学習での役割海外での方が有名？機械学習や深層学習を学ぶ上で、数学は言語である以前、学びたい機械学習のレベルに応じて、どんな数学が必要になってくるのかを紹介しました（以下の記事）。 s0sem0y.hatena blog.com そのときにも述べましたが、数学というのは何らかの操作を非常に簡潔に表現してくれます。要するに情報をギュッと圧縮して伝える手
Syunpei 2016/11/11
Machine Learning

Deep Learning

あとで読む
リンク
1

はてなブックマーク

タグ

ブックマーク / www.hellocybernetics.tech (2)

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第1週）

【復旧済】はてなブックマークへの接続ができない・不安定になる障害が発生していました

月間はてなブックマーク数ランキング（2025年3月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / www.hellocybernetics.tech (2)

強化学習に出てくるベルマン方程式を理解しよう - HELLO CYBERNETICS

機械学習を学ぶ上で抑えておきたい数学２ - HELLO CYBERNETICS

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第1週）

【復旧済】はてなブックマークへの接続ができない・不安定になる障害が発生していました

月間はてなブックマーク数ランキング（2025年3月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス