世界トップ棋士に勝利した囲碁AI「AlphaGo」がさらに進化した「AlphaGo Zero」を、Googleの関連会社DeepMindがNatureの論文で発表しました。 AlphaGoは人間の対局のデータを学習させていましたが、AlphaGo Zeroはそういったプロセスは経ずに、試行錯誤することで学ぶ「強化学習」の手法を取りました。AlphaGo Zeroは自身を相手に対局を繰り返すことで学習して強くなり、学習を始めて3日後には、李世ドル九段に勝ったAlphaGoのバージョン(Lee)に100勝0敗で勝てるように。40日後には、柯潔九段(世界ランキングトップ)に勝利したバージョン(Master)を超えました。 AlphaGo各バージョンのイロレーティング DeepMindは、AlphaGo Zeroの学習手法は人間の知識の限界に制約を受けないため、これまでのバージョンよりも強力だとし
![囲碁AI「AlphaGo」が進化した「AlphaGo Zero」開発 自己との対局で学習し強く](https://cdn-ak-scissors.b.st-hatena.com/image/square/d497dfdca50a1dca2624411ab5e153da9fc1f166/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fnl%2Farticles%2F1710%2F19%2Fl_ah_alpha0.jpg)