Google系列のAI企業DeepMindの強化学習採用AI「AlphaZero」が、チェスのAI世界チャンピオン「Stockfish」、世界コンピュータ将棋選手権の2017年の勝者「elmo」、そして自社の囲碁AIで世界最強の「AlphaGo Zero」に勝利した。 米Alphabet傘下の英DeepMindは12月6日(現地時間)、「AlphaGo Zero」から進化させた強化学習採用のAI「AlphaZero」が、チェス、将棋、囲碁のそれぞれの世界最強AIを打ち負かしたと発表した。 強化学習(reinforcement learning)は大まかに言うと、学習用のデータを使わずに、AIが選択した行動が正しければ報酬を与えることで、AIの状況判断能力を上げていく機械学習方式。AlphaZeroはまた、行動の選択に「モンテカルロ木探索(MCTS)」と呼ばれる検索アルゴリズムを使う。 Al