IMPALAはマルチタスク強化学習を実現するため、複数アクターの実行履歴を学習器に集約し、学習器とアクターの方策のずれを吸収する学習手法V-traceを提案。はじめて単一エージェントによるAtariスケールのマルチタスク学

elu_18elu_18 のブックマーク 2018/02/07 12:23

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures

    In this work we aim to solve a large collection of tasks using a single reinforcement learning agent with a single set of parameters. A key challenge is to handle the increased amount of data and e...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう