2014年4月16日のブックマーク (1件)

  • 電王戦最終局 屋敷九段とPonanzaの自戦記(後半) - 山本一成とPonanzaの大冒険

    前回の記事の最後にFail Lowという言葉がでました。コンピュータ将棋はある局面を探索するときに、評価値をある程度予想して、その予想を元に探索をします。予想値の下限をアルファ、予想値の上限をベータといいます。よく聞くアルファベータ探索のアルファとベータはここから来てます。評価値がアルファより下の場合Fail Low、評価値がベータより上の場合はFail Highといいます(第1図)。Fail Lowが起こる時は予想より実際の評価値が大きく下回る場合で、かなり良くない状況です。Fail Lowがおこった場合は、アルファとベータの予想値を再修正して探索し直します。 第1図 難解な局面では予想が難しいので、Fail Low(↓)やFail High(↑)することがよく起こる。評価値に矢印をつけるのはPonanza独自の拡張. Fail Lowは業績下方修正、Fail highは業績上方修正のよ

    電王戦最終局 屋敷九段とPonanzaの自戦記(後半) - 山本一成とPonanzaの大冒険
    yaneurao
    yaneurao 2014/04/16
    Fail Lowのときは、評価値の右端に「↓」を入れるより、探索深さの右端に「↓」を入れたほうがいいのでは。評価値の右端に「↓」を入れているとfloodgateなどに送信したときに評価値グラフが正しく描けないように思う。