エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
学生時代に頑張ったことが何もない
前にDQNの再現の記事を書いてからほぼ1年が空いてしまいました.DQNの新しい論文が2月にNatureに載った... 前にDQNの再現の記事を書いてからほぼ1年が空いてしまいました.DQNの新しい論文が2月にNatureに載ったのは記憶に新しいですが,それから研究はさらに加速し,最近では自分の感覚としてはarxiv含めて平均すると1週間に1論文くらいのペースで深層強化学習の研究が発表されているのではないかと思います(ちゃんと計算してないので全然違ってたらすみません). これだけ論文が増えるとまとめのようなものが欲しくなるので,自分で作ることにしました. https://github.com/muupan/deep-reinforcement-learning-papers まだだいぶ不完全ですし,論文リストをきちんとした形で作るのははじめてなのでいろいろと迷う部分があるのですが,これから少しずつ充実させていく予定です. 概要 深層学習フレームワークCaffeを使って,Deep Q-Networkという深層