三目並べで強化学習を練習してみた - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/UKI_datascience

1user がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

三目並べで強化学習を練習してみた - Qiita

はじめに今回は、「ChatGPTにハンズオンを作らせてみた」の第8弾で、三目並べを使って強化学習（Q学習... はじめに今回は、「ChatGPTにハンズオンを作らせてみた」の第8弾で、三目並べを使って強化学習（Q学習）を勉強しました。第7弾はこちら↓ 使用コード・結果 import numpy as np import random class TicTacToeEnv: def __init__(self, seed=42): self.board = np.zeros((3, 3), dtype=int) # 0: 空白, 1: X, -1: O self.seed = seed self.reset() def set_seed(self): """ 乱数のシードを固定 """ random.seed(self.seed) np.random.seed(self.seed) def reset(self): """ 初期状態のボードをセット """ self.set_seed() self

ブックマークしたユーザー

aont2025/02/25

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx