注:今回の記事は完全にプログラマ向けの解説記事です ソースコードの閲覧、ダウンロードは此方からどうぞ GitHub - qhapaq-49/chainerrl_test: chainerrlを使ったスタンドアロンな強化学習のサンプルです 【前回の記事(tensorflow版)】 ゼロから創る tensorflow + reinforcement learningを使ったディープラーニングもどき - qhapaq’s diary 【今回の記事と合わせてオススメしたい記事】 ChainerRLで三目並べを深層強化学習(Double DQN)してみた - Qiita # 正直、本稿よりも此方の記事のほうが良く出来ています。 【今回作りたいもの】 前回に引き続き、今度はchainerrlでニューラルネット+強化学習を組んでみました。 今回も200行程度で動くスタンドアロンな強化学習のサンプルを公開