ドラクエ風バトルでQ学習してみる【強化学習入門】 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/nanoseeing

1user がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

ドラクエ風バトルでQ学習してみる【強化学習入門】 - Qiita

何をやるか？超シンプルなドラクエ風ターン制バトルを作ってQ学習させてみます。数％の確率でしか世界... 何をやるか？超シンプルなドラクエ風ターン制バトルを作ってQ学習させてみます。数％の確率でしか世界を救えない勇者くんを、Q学習で賢くすることが目的です。なお、ゲーム部分・Q学習の実装については解説しますが、Q学習そのものは解説しません。 Q学習の詳しい理論を知りたい方は、こちらの良記事を一つずつ読んでいくと幸せになれます。今さら聞けない強化学習（1）：状態価値関数とBellman方程式読んでもらいたい人 OpenAI Gymなどの既存のシミュレーション環境ではなく、自分でゲームを作って色々弄ってみたい方。 Q学習の理論はなんとなく知ってるんだけど、「どうやって実装すれば良いかわからない！」という方。ゲームをつくるルールはシンプルに、以下のように設計します。勇者 vs 魔王の1対1 魔王のとる行動は「攻撃」のみ勇者のとれる行動は「攻撃」と「回復」の2択行動順序は、各キャラの

ブックマークしたユーザー

同じサイトの新着

tqdmでメモリリークにハマった話（機械学習） - Qiita

1 userqiita.com/nanoseeing

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx