
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Pythonの強化学習ライブラリKeras-RLのパラメータ設定 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Pythonの強化学習ライブラリKeras-RLのパラメータ設定 - Qiita
はじめに PythonライブラリKeras-RLは強化学習のことがあまりわかっていなくても使えてしまうのですが、... はじめに PythonライブラリKeras-RLは強化学習のことがあまりわかっていなくても使えてしまうのですが、 細かいチューニングをしようと思うとパラメータの意味を理解していないといけません。 そうすると強化学習の数式レベルの理解がある程度必要になります (行動価値関数などの最終的な式の意図や動作が把握できている程度でよい)。 よくわかっていないという人は個人的には以下の連載記事が一番わかりやすかったのでおすすめです。 今さら聞けない強化学習(1):状態価値関数とBellman方程式 本記事では、Keras-RLの各パラメータがどのような意味を持つのかを説明しながら、 実際の設定値などを紹介していきたいと思います。 (私も完全に理解している訳ではないので誤りがありましたらコメントいただければと思います) 想定読者 強化学習の思想やKeras-RLの使い方の流れはわかったけど、細かいパラメ