深い強化エンドツーエンドの運転のための学習は、複雑な報酬エンジニアリングの必要性によって制限されます。報酬がまばらであると、この課題を回避できますが、トレーニング時間が長くなり、最適ではないポリシーに

arxiv_readerarxiv_reader のブックマーク 2021/03/17 11:43

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

エンドツーエンドの運転のための目標制約付きスパース強化学習

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう