[B! chainerrl] yukimori_726のブックマーク

yukimori_726 id:yukimori_726

chainerrlに関するyukimori_726のブックマーク (2)

ゼロから創る chainerrl を使ったディープラーニングもどき - コンピュータ将棋 Qhapaq
注：今回の記事は完全にプログラマ向けの解説記事ですソースコードの閲覧、ダウンロードは此方からどうぞ GitHub - qhapaq-49/chainerrl_test: chainerrlを使ったスタンドアロンな強化学習のサンプルです【前回の記事（tensorflow版）】ゼロから創る tensorflow + reinforcement learningを使ったディープラーニングもどき - qhapaq’s diary 【今回の記事と合わせてオススメしたい記事】 ChainerRLで三目並べを深層強化学習（Double DQN）してみた - Qiita # 正直、本稿よりも此方の記事のほうが良く出来ています。【今回作りたいもの】前回に引き続き、今度はchainerrlでニューラルネット＋強化学習を組んでみました。今回も200行程度で動くスタンドアロンな強化学習のサンプルを公開
yukimori_726 2017/12/19
chainerrl
リンク
【強化学習】DQNを秒速で扱える『ChainerRL』使い方メモ - プロクラシスト
こんにちは、ほけきよです！強化学習って知ってますか？「Alpha Goが、碁の世界王者を破った」などと最近脚光を浴びている機械学習技術ですね。私のブログでも何回か関連記事を出しているのですが、今回は、Chainerで強化学習を簡単に扱えるツール、「ChainerRL」を使ってみました！なかなか便利だったので使い方を解説やまとめ、Tipsを加えながらメモしてみました。 (コードはjupyter準拠なので、上から順番にコピペすると基本は動くはずです) これから強化学習やってみたいという人は、これで強化学習がどんなものか試してみるのもいいかもしれません！強化学習って？ chainerrl Setup 必要なライブラリをimportする environmentの設定 environmentに必要な要件(最低限) 今回使うもの Agentの設定 ChainerRLでデフォで実装されている
yukimori_726 2017/03/21
chainerrl

chainer

dqn
リンク
1