1. はじめに「Unity ML-Agents」で、強化学習の学習環境を作成する手順を説明します。ボール(RollerAgent)が立方体(Target)に向かって転がるように訓練する学習環境になります。 今回の学習環境の要素は次のとおりです。 ・観察 ・Vector Observation (サイズ8) 0 : TargetのX座標 1 : TargetのY座標 2 : TargetのZ座標 3 : RollerAgentのX座標 4 : RollerAgentのY座標 5 : RollerAgentのZ座標 6 : RollerAgentのX速度 7 : RollerAgentのZ速度 ・行動 ・Continuous (サイズ2) 0: RollerAgentのX方向に加える力 1: RollerAgentのZ方向に加える力 ・報酬 : ・RollerAgentがTargetの位置に到