2016年1月8日のブックマーク (1件)

  • ひまうら王実験結果その3 | やねうら王 公式サイト

    前回の続き。 技巧(2012)が採用していたBishopLerningで詰みのある局面での指し手を教示信号として、終盤の指し手を学習中です。さて、こうして学習させた将棋ソフトは次のうちどうなるでしょうか? — やねうら王 (@yaneuraou) December 1, 2015 大多数の予想に反して、詰みのある局面から学習させても終盤は全く強くならない。学習させればさせるほど、ひようら王(ひよこ将棋)との勝率は落ちるので、マイナスの何かを学習してしまっている。 そりゃ詰みのある局面からだと、十中八九は飛車も角もぶった切って金並べて詰みなんだから、 金の価値>>>超えられない壁>>>飛車の価値 みたいな学習がなされてしまう。過学習(過剰適合)と言えるだろう。 じゃあ、この手法自体が間違っていて、何も学習されていないのかというと、序盤はそうでもない。 次の局面は、この手法で学習させたひまうら

    ひまうら王実験結果その3 | やねうら王 公式サイト