Google DeepMind、AlphaGoに圧勝(100勝0敗)する新たな囲碁AIプログラム「AlphaGo Zero」を発表。囲碁の基礎ルールのみ教え3日間で500万回強化学習 2017-10-19 Google DeepMindは、囲碁の世界トッププロ棋士を破ってきたコンピュータ囲碁AIプログラム「AlphaGo」に圧勝する新たな人工知能プログラム「AlphaGo Zero」を論文にて発表しました。 Mastering the game of Go without human knowledge(PDF) AlphaGoは、数千もの打ち手のデータを学習し強化しましたが、AlphaGo Zeroは、このステップをスキップし、答えなしの白紙の状態からランダムにプレイし強化学習する手法を取り入れます。 過去のデータからではなく、囲碁の基本ルールだけ教えて、あとはAI同士が教師なし学習で対