The MIT Press Cambridge, Massachusetts London, England
Newly released beta version! There now is a Winboard version that can handle bigger boards, and a Fairy-Max engine that can run under it (download) The GUI knows the rules of Capablanca Chess, while Fairy-Max can play a wide variety of board sizes and piece types, as it allows user-defined pieces. My original aim was to write a chess program smaller than 1024 characters. I could not do it, so far.
強化学習の学習法の1つである Sarsa(λ) アルゴリズムを Introduction to Reinforcement learning(リンク切れ)に載っていたプログラムを参考に実装してみた。手元の本にはアルゴリズムが擬似コードで載っているだけなので、細かい実装法で分からないところがあったのだが、これ1つ実装してみただけで見通しがすごくよくなった。強化学習はアルゴリズムがたくさん提案されているが、ほとんど構造は似たようなものなので、これを参考に他のも実装して実験できるようになるだろう。 このプログラムでは迷路の抜け方を学習するんだけど、実際に実行してみて感動した!強化学習は教師なし学習なので迷路の抜け方を具体的に教えない。ただ報酬を定義してやるだけで見事に最適な抜ける方法を導き出した(報酬はエージェントの行動を誘導しているが、具体的な方法を指示しているわけではない)。これって、不可解
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く