
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ブラックジャックの戦略を強化学習で作ってみる(②gymに環境を登録) - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
ブラックジャックの戦略を強化学習で作ってみる(②gymに環境を登録) - Qiita
はじめに Pythonと強化学習の勉強を兼ねて,ブラックジャックの戦略作りをやってみました. ベーシック... はじめに Pythonと強化学習の勉強を兼ねて,ブラックジャックの戦略作りをやってみました. ベーシックストラテジーという確率に基づいた戦略がありますが,それに追いつけるか試してみます. こんな感じで進めていきます ブラックジャック実装 OpenAI gymの環境に登録 ← 今回はここ 強化学習でブラックジャックの戦略を学習 OpenAIのgymとは 強化学習の研究環境として使われるプラットフォームです. CartPoleや迷路などの環境(ゲーム)が用意されており,簡単に強化学習を試すことができます. OpenAI Gymの環境は,エージェントからの行動を受け取り,その結果としてその次の状態と報酬を返す共通のインターフェースを持っています. インストールは以下のように簡単にできますが,詳しい方法は他のページを参考にしてください.以下,インストールが終わってるものとして説明します. 今回はこ