yukimori_726のブックマーク - はてなブックマーク

ゼロから創る chainerrl を使ったディープラーニングもどき - コンピュータ将棋 Qhapaq
注：今回の記事は完全にプログラマ向けの解説記事ですソースコードの閲覧、ダウンロードは此方からどうぞ GitHub - qhapaq-49/chainerrl_test: chainerrlを使ったスタンドアロンな強化学習のサンプルです【前回の記事（tensorflow版）】ゼロから創る tensorflow + reinforcement learningを使ったディープラーニングもどき - qhapaq’s diary 【今回の記事と合わせてオススメしたい記事】 ChainerRLで三目並べを深層強化学習（Double DQN）してみた - Qiita # 正直、本稿よりも此方の記事のほうが良く出来ています。【今回作りたいもの】前回に引き続き、今度はchainerrlでニューラルネット＋強化学習を組んでみました。今回も200行程度で動くスタンドアロンな強化学習のサンプルを公開
yukimori_726 2017/12/19
chainerrl
リンク
1

はてなブックマーク