
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ドラクエ風バトルでQ学習してみる【強化学習入門】 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
ドラクエ風バトルでQ学習してみる【強化学習入門】 - Qiita
何をやるか? 超シンプルなドラクエ風ターン制バトルを作ってQ学習させてみます。 数%の確率でしか世界... 何をやるか? 超シンプルなドラクエ風ターン制バトルを作ってQ学習させてみます。 数%の確率でしか世界を救えない勇者くんを、Q学習で賢くすることが目的です。 なお、ゲーム部分・Q学習の実装については解説しますが、Q学習そのものは解説しません。 Q学習の詳しい理論を知りたい方は、こちらの良記事を一つずつ読んでいくと幸せになれます。 今さら聞けない強化学習(1):状態価値関数とBellman方程式 読んでもらいたい人 OpenAI Gymなどの既存のシミュレーション環境ではなく、自分でゲームを作って色々弄ってみたい方。 Q学習の理論はなんとなく知ってるんだけど、「どうやって実装すれば良いかわからない!」という方。 ゲームをつくる ルールはシンプルに、以下のように設計します。 勇者 vs 魔王の1対1 魔王のとる行動は「攻撃」のみ 勇者のとれる行動は「攻撃」と「回復」の2択 行動順序は、各キャラの