
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
CPUで気軽に強化学習してみた話(DeepMind A3C) - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
CPUで気軽に強化学習してみた話(DeepMind A3C) - Qiita
どうもオリィ研究所(http://orylab.com)の畑中です。 近ごろ強化学習界隈の盛り上がりが素晴らしく、Ope... どうもオリィ研究所(http://orylab.com)の畑中です。 近ごろ強化学習界隈の盛り上がりが素晴らしく、OpenAI UniverseやDeepMind Labのようなプラットフォームがリリースされるなど、開発は今後さらに活発化していくと思われます。ですが従来のDQN等の強化学習手法だとGPUや大規模分散環境が前提になっていたりとハード面がネックになって気軽に試すというわけにもいかなかったりすることが多いかと思います。 ということで何かいいものはないかと探していたところ、DeepMindが開発したA3Cという手法が良さげだったので、手元のMacBookで気軽に強化学習してみます。 A3Cとは Asynchronous Advantage Actor-Criticの略記です。 DeepMindが2016年に発表した手法で、従来の手法のようにGPUや大規模分散環境等の特殊なハードウェ