コンピュータ将棋協会のブログで知ったのですが、ゲームプログラミングの学会GPW2007の話題の中心はボナンザタイプの機械学習による評価関数のデザインと、UCTらしい。 機械学習については、以前調べて、大体のどんな感じのものかおぼろげに理解したけれど、UCTってなんなのか、まったく言葉すら知らなかったのでちょっと調べてみた。 ついでにプログラムを組んでみた。 UCTって何か? これは、モンテカルロ囲碁で最近流行の手法で、UCB1を使ってゲームの木のノードを下ってからモンテカルロシミュレーションする手法のことらしい。 UCB1ってなにか? ぶっちゃた言い方をすると、パチンコの台選びを想像するのが理解しやすいかも。 釘が読めない前提でパチンコで台を選ぶとき、それぞれの台を試し打ちして、スタートチャッカーへの入賞率が高い台(いわゆる良く回る台)を探す。 そのとき、「そこそこ回るパチンコ台を見つけた
![UCTを利用したモンテカルロ法とミスに着目したゲームの特性 - マッタリプログラミング日誌](https://cdn-ak-scissors.b.st-hatena.com/image/square/1af810db046bc597b58543c4e6cf0e37e5dc5950/height=288;version=1;width=512/http%3A%2F%2Fkmo2.cocolog-nifty.com%2Fprog%2Fimages%2F2008%2F03%2F12%2F753.jpg)