強化学習ベースの4脚歩行ロボットが、スイスの山中で低山のハイキングに成功した。標高差120mほどの自然の山道を自律的に登り、頂上に到達。そのまま下山して登山口に帰ってくるまで一度の転倒もなく、1時間ほどの行程を人間の手助けなしに安定的にこなした(図1、図2)。 道中には、木の根が浮き出た斜面、石が乱雑に敷き詰められた道、最大38%の勾配、そして木の階段などがあったが、そんな険しい自然の山道をセンサを使って環境認識しながら安定的に走破した。踏破時間も人間の場合より短かった注1)。この技術は積雪期にも対応したほどだ(図3)。これまでロボット向け強化学習は長らく研究されてきたが、実用面では人間が作り込んだ制御器が優っている傾向が強かった。そうした序列が覆った事例の1つといえる。