by Olav Ahrens Røtne 囲碁のトップ棋士に勝利したAI「AlphaGo」は、自らの進化形として生まれた「AlphaGo Zero」に、誕生からわずか30時間で超えられてしまいました。AlphaGoとAlphaGo Zeroの違いは、AlphaGo Zeroが人間の棋譜を参考にせず、自身による強化学習で鍛錬を重ねたという点にありました。これと同じように、カリフォルニア大学アーバイン校(UCI)が生み出した深層強化学習アルゴリズム「DeepCubeA」は、人間の手助けなく、ルービックキューブをほんの一瞬で解けるようになったそうです。 UCI researchers’ deep learning algorithm solves Rubik’s Cube faster than any human | UCI News | UCI https://news.uci.edu/20
![ルービックキューブを一瞬で解くことに深層強化学習アルゴリズムが成功](https://cdn-ak-scissors.b.st-hatena.com/image/square/c02dfbcce48f161d21fa48c2b6ee869cca98f8f5/height=288;version=1;width=512/https%3A%2F%2Fi.gzn.jp%2Fimg%2F2019%2F07%2F17%2F%2Frubiks-cube-solve-deepcubea%2F00.jpg)