人工知能(AI)の多くは、理想化された環境で開発されている。つまり、現実世界の起伏を省略して表現したコンピューターシミュレーションだ。囲碁やチェス、テレビゲームをプレイさせることを目的として作られたDeepMindの「MuZero」や、文章を生成するために作られたOpenAIの「GPT-3」もそうだが、高度な深層学習プログラムのほとんどは、余分なものを刈り込んだ制約のセットをトレーニングに使用することで大きなメリットを受けている。 それを考えれば、完全には予期できない現実世界のさまざまな制約を考慮しなければならないロボット工学への深層学習の応用は、この領域ではもっとも困難である一方で、ひょっとするともっとも有望な研究なのかもしれない。 これが、カリフォルニア大学バークレー校とGoogleの研究者が、強化学習と呼ばれる技術を使って数年間にわたって行ってきたロボットの実験についてまとめたレポー
![「AlphaZero」の先へ--強化学習によるロボット訓練、研究者が示した複雑さと期待(ZDNet Japan) - Yahoo!ニュース](https://cdn-ak-scissors.b.st-hatena.com/image/square/3404d80f1ca263c2e2ad1e272598474cd1d5de8c/height=288;version=1;width=512/https%3A%2F%2Famd-pctr.c.yimg.jp%2Fr%2Fiwiz-amd%2F20210329-35167693-zdnet-000-1-view.jpg)