エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
[How to!] スーパーマリオをTensorflowで学習&プレイしよう!! - Qiita
$ vi /usr/local/lib/python3.6/site-packages/gym_pull/monitoring/monitor.py : : class Monitor(gym.... $ vi /usr/local/lib/python3.6/site-packages/gym_pull/monitoring/monitor.py : : class Monitor(gym.monitoring.monitor.Monitor): ↓ class Monitor(gym.monitoring.monitor_manager.MonitorManager): プログラムについての簡単な説明 学習方法は強化学習(Reinforcement Learning)で行います。 教師あり学習とも教師なし学習とも少し違い実行したアクションの評価を学習します。 [参考] Deep Q-Network 以下に記事にDQNの説明がありました。 DQNの生い立ち + Deep Q-NetworkをChainerで書いた [参考] 人の操作を学習する。 自分達で実行した結果を評価に学習させると
2017/07/13 リンク