エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
三目並べで強化学習を練習してみた - Qiita
はじめに 今回は、「ChatGPTにハンズオンを作らせてみた」の第8弾で、三目並べを使って強化学習(Q学習... はじめに 今回は、「ChatGPTにハンズオンを作らせてみた」の第8弾で、三目並べを使って強化学習(Q学習)を勉強しました。 第7弾はこちら↓ 使用コード・結果 import numpy as np import random class TicTacToeEnv: def __init__(self, seed=42): self.board = np.zeros((3, 3), dtype=int) # 0: 空白, 1: X, -1: O self.seed = seed self.reset() def set_seed(self): """ 乱数のシードを固定 """ random.seed(self.seed) np.random.seed(self.seed) def reset(self): """ 初期状態のボードをセット """ self.set_seed() self

