[B! algorithm][programming] suireNのブックマーク

suireN id:suireN

algorithmとprogrammingに関するsuireNのブックマーク (10)

Lecture - 19 GraphPLAN and SATPlan
suireN 2010/01/08
YouTube

programming

algorithm
リンク
Graphplan home page
suireN 2010/01/08
プランニング、GRAPHPLANアルゴリズム

java

programming

algorithm
リンク
master_thesis.dvi
suireN 2009/07/30
SVM(サポートベクターマシン)サポートベクトルマシンを用いた将棋の詰将棋判定

programming

論文

algorithm
リンク
Fenrir's BLog: Othelloプログラム(強化学習による実装)
suireN 2009/07/18
algorithm

programming
リンク
Reinforcement Learning
The MIT Press Cambridge, Massachusetts London, England
suireN 2009/07/18
強化学習、sarsa(lambda)

programming

algorithm

book

覚書
リンク
Micro-Max
Newly released beta version! There now is a Winboard version that can handle bigger boards, and a Fairy-Max engine that can run under it (download) The GUI knows the rules of Capablanca Chess, while Fairy-Max can play a wide variety of board sizes and piece types, as it allows user-defined pieces. My original aim was to write a chess program smaller than 1024 characters. I could not do it, so far.
suireN 2009/07/18
チェスアルゴリズム、コンピュータチェス、prolog課題用

programming

algorithm
リンク
ファジィ環境評価ルールを用いた強化学習の提案とチェスへの応用 | CiNii Research
suireN 2009/07/16
algorithm

programming
リンク
Reinforcement Learning
suireN 2009/07/15
prolog

programming

algorithm
リンク
Sarsa（λ） - 人工知能に関する断創録
強化学習の学習法の１つである Sarsa(λ) アルゴリズムを Introduction to Reinforcement learning（リンク切れ）に載っていたプログラムを参考に実装してみた。手元の本にはアルゴリズムが擬似コードで載っているだけなので、細かい実装法で分からないところがあったのだが、これ1つ実装してみただけで見通しがすごくよくなった。強化学習はアルゴリズムがたくさん提案されているが、ほとんど構造は似たようなものなので、これを参考に他のも実装して実験できるようになるだろう。このプログラムでは迷路の抜け方を学習するんだけど、実際に実行してみて感動した！強化学習は教師なし学習なので迷路の抜け方を具体的に教えない。ただ報酬を定義してやるだけで見事に最適な抜ける方法を導き出した（報酬はエージェントの行動を誘導しているが、具体的な方法を指示しているわけではない）。これって、不可解
suireN 2009/07/14
programming

prolog

algorithm

ai
リンク
強化学習
suireN 2009/07/14
prolog

programming

algorithm
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx