倒立振子でDQNにおけるモデルの複雑さと学習内容の関係をちらっと確かめてみた系の話 - めもめも

学びカテゴリーの変更を依頼記事元:

enakai00.hatenablog.com

29 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

imslotter そうそう、強化学習でこういうことをしたいんだよ！理論はわかっててもなかなかコード書いて実践するのって、壁があって難しい。githubでコード参照できるの、めっちゃありがたい

2016/11/10 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

倒立振子でDQNにおけるモデルの複雑さと学習内容の関係をちらっと確かめてみた系の話 - めもめも

何の話かというと qiita.com 上記の記事では、「倒立振子」を題材にした、DQN（Deep Q Network）による... 何の話かというと qiita.com 上記の記事では、「倒立振子」を題材にした、DQN（Deep Q Network）による強化学習の解説があり、非常によくまとまっています。一方、この記事の中では、全結合層を4層に重ねたネットワークを利用しているのですが、倒立振子の問題に限定すれば、もっとシンプルなネットワークでも対応できる気がしなくもありません。というわけで、「0層（パーセプトロン）」「1層」「2層」のネットワークでどこまで学習できるのか、モデルの複雑さと学習内容の関係を確認してみたよー、というのがこのブログのネタになります。 DQNとは？まずは簡単にDQNを解説しておきます。ビデオゲームの自動プレイで有名になりましたが、「与えられた環境において、最善の行動を選択する」という処理を実現することが目標です。ここで言う「行動」は、ビデオゲームの操作のように、「どのボタンを押すのか」と

ブックマークしたユーザー

tsu-nera2017/06/09
chess-news2017/05/30
ma38su2016/12/31
maghrib2016/11/10
imslotter2016/11/10
moccos_info2016/08/03
motobrew2016/06/23
orehajikoranai2016/06/17
hocknetwork2016/06/09
roomba2016/05/23
wrgbh4462016/05/22
TERMINATOR_T8002016/05/21
freakyyy_com2016/05/21
saitodevel012016/05/21
goodstoriez2016/05/21
dalmacija2016/05/20
pulltop-birth2016/05/20
yukimori_7262016/05/20

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - 学び

いま人気の記事 - 学びをもっと読む

新着記事 - 学び

新着記事 - 学びをもっと読む

設定を変更しましたx