3. 強化学習とは ある環境内におけるエージェントが、 現在の状態を観測し、取るべき行動 を決定する問題を扱う機械学習の一 種。 エージェントは行動を通じて、報酬が 最も沢山得られるように学習する Portions of this page are modifications based on work created and shared by Google and used according to terms described in the Creative Commons 3.0 Attribution License. エージェント 環境 報酬状態