タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

強化学習に関するsek_165のブックマーク (2)

  • DeepMind社のAtariゲーム攻略論文のコード等を試行中 - Itsukaraの日記

    DeepMind社が有名になるキッカケとなった論文「Playing Atari with Deep Reinforcement Learningの内容を実装して試した記事「DQNをKerasとTensorFlowとOpenAI Gymで実装する」を、深層学習の輪講メンバーで読みながら、実際に実行させて試しています。 必要となる環境「KerasとTensorFLowとOpenAI Gymを載せたUbuntu 14.04 PC(16GB RAM + GTX760)」は整備が完了しており、ソースコードと共に、28時間学習済みのデータも公開されているので、学習結果をすぐに試すことができました。 youtu.be ただ、28時間の学習結果を使ってゲーム画面を表示させても、まだまだ動きが不自然で、SCOREがほとんど伸びません(玉が5個あり、点数は10点〜20点、つまり2〜4点/玉)。記事では、「もっ

    DeepMind社のAtariゲーム攻略論文のコード等を試行中 - Itsukaraの日記
  • 『これからの強化学習』という本が良さそう。遅れをとる日本のDQNを引っ張ってほしい。 - プロクラシスト

    これからの強化学習 10/27発売予定の、強化学習に関する最新技術を書いた これからの強化学習 作者: 牧野貴樹,澁谷長史,白川真一,浅田稔,麻生英樹,荒井幸代,飯間等,伊藤真,大倉和博,黒江康明,杉徳和,坪井祐太,銅谷賢治,前田新一,松井藤五郎,南泰浩,宮崎和光,目黒豊美,森村哲郎,森淳,保田俊行,吉潤一郎出版社/メーカー: 森北出版発売日: 2016/10/27メディア: 単行(ソフトカバー)この商品を含むブログ (2件) を見る 強化学習の「いま」を知り,「これから」を切り拓くための1冊. 書では,この分野を代表する執筆陣が集い,強化学習の基礎・発展・応用を多面的に解説します. ・基礎:強化学習の動作原理と基アルゴリズムを,初学者でも分かるように導入. ・発展:より複雑な問題に対処し,高度な研究に進むための,さまざまな発展的手法を解説. ・応用:マルチロボットシステムの

    『これからの強化学習』という本が良さそう。遅れをとる日本のDQNを引っ張ってほしい。 - プロクラシスト
  • 1