Chainerで機械学習と戯れる：足し算ゲームをChainerを使って強化学習できるか？ - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/mokemokechicken

3 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Chainerで機械学習と戯れる：足し算ゲームをChainerを使って強化学習できるか？ - Qiita

はじめに以前の足し算ゲームを強化学習で学習できるか？では、単純な足し算ゲームの良い行動を Q-Learn... はじめに以前の足し算ゲームを強化学習で学習できるか？では、単純な足し算ゲームの良い行動を Q-Learningという方法で学習してみました。今回は同じゲームを Chainerを使って学習させることにします。ただ、完全に手探りで作ったので、正しくない箇所もまだ残っていそうですが、一応学習できたので投稿しておきます。お題: 足し算ゲーム by Chainer 前回と同じで、以下のゲームを考えます。状態S: 0~9 の整数アクションA: 1~4の整数次状態S': (S + A) % 10 報酬R: +1: S' == 7 -100: S' in (5, 9) 実験実験に使ったソースコードはこちらです。基本的には、前回のQLearningPlayer を NNQLearningPlayer に置き換える形になります。まだ間違っている箇所もありそうですし、色々わからなかった、ハマ

chainer

ブックマークしたユーザー

tokuryoo2016/03/03
kitanokumo2015/07/19

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx