[B! 強化学習] sek_165のブックマーク

sek_165 id:sek_165

強化学習に関するsek_165のブックマーク (2)

DeepMind社のAtariゲーム攻略論文のコード等を試行中 - Itsukaraの日記
DeepMind社が有名になるキッカケとなった論文「Playing Atari with Deep Reinforcement Learningの内容を実装して試した記事「DQNをKerasとTensorFlowとOpenAI Gymで実装する」を、深層学習の輪講メンバーで読みながら、実際に実行させて試しています。必要となる環境「KerasとTensorFLowとOpenAI Gymを載せたUbuntu 14.04 PC(16GB RAM + GTX760)」は整備が完了しており、ソースコードと共に、28時間学習済みのデータも公開されているので、学習結果をすぐに試すことができました。 youtu.be ただ、28時間の学習結果を使ってゲーム画面を表示させても、まだまだ動きが不自然で、SCOREがほとんど伸びません(玉が5個あり、点数は10点〜20点、つまり2〜4点/玉)。記事では、「もっ
sek_165 2017/06/13
強化学習
リンク
『これからの強化学習』という本が良さそう。遅れをとる日本のDQNを引っ張ってほしい。 - プロクラシスト
これからの強化学習 10/27発売予定の、強化学習に関する最新技術を書いた本これからの強化学習作者: 牧野貴樹,澁谷長史,白川真一,浅田稔,麻生英樹,荒井幸代,飯間等,伊藤真,大倉和博,黒江康明,杉本徳和,坪井祐太,銅谷賢治,前田新一,松井藤五郎,南泰浩,宮崎和光,目黒豊美,森村哲郎,森本淳,保田俊行,吉本潤一郎出版社/メーカー: 森北出版発売日: 2016/10/27メディア: 単行本（ソフトカバー）この商品を含むブログ (2件) を見る強化学習の「いま」を知り，「これから」を切り拓くための1冊．本書では，この分野を代表する執筆陣が集い，強化学習の基礎・発展・応用を多面的に解説します．・基礎：強化学習の動作原理と基本アルゴリズムを，初学者でも分かるように導入．・発展：より複雑な問題に対処し，高度な研究に進むための，さまざまな発展的手法を解説．・応用：マルチロボットシステムの
sek_165 2017/02/16
強化学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx