サクサク読めて、アプリ限定の機能も多数!
ほとんどの現実世界のシナリオでは、ある環境で強化学習によってトレーニングされたポリシーを、別の、場合によってはまったく異なる環境に展開する必要があります。ただし、さまざまな環境にまたがる一般化は難しい
arxiv_reader のブックマーク 2020/12/14 12:05
展開中の自己監視ポリシーの適応[simulation][self-supervised][domain][robot][reinforcement learning][arXiv][arXiv reaDer][adaptation]ほとんどの現実世界のシナリオでは、ある環境で強化学習によってトレーニングされたポリシーを、別の、場合によってはまったく異なる環境に展開する必要があります。ただし、さまざまな環境にまたがる一般化は難しい2020/12/14 12:05
このブックマークにはスターがありません。 最初のスターをつけてみよう!
arxiv-check-250201.firebaseapp.com2020/12/14
1 人がブックマーク・1 件のコメント
\ コメントが サクサク読める アプリです /
ほとんどの現実世界のシナリオでは、ある環境で強化学習によってトレーニングされたポリシーを、別の、場合によってはまったく異なる環境に展開する必要があります。ただし、さまざまな環境にまたがる一般化は難しい
このブックマークにはスターがありません。
最初のスターをつけてみよう!
展開中の自己監視ポリシーの適応
1 人がブックマーク・1 件のコメント
\ コメントが サクサク読める アプリです /