ハノイの塔の状態推移図がわかる動画。任意の状態からゴールまでの最短経路もこれですぐに分かります。 https://t.co/h9cBlDI6uJ
タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。
強化学習はゲームやパズルを解く機械学習の手法であり、過去記事1にて、ハノイの塔を強化学習で解く方法を検証しました。 本記事では、ポールの数を3本から4本、5本、…と増やした一般化ハノイの塔について考察します。内容は、以下の2つです。 ・動的計画法による最短手順の導出 ・強化学習による求解 ※ソースコードをGitHubに公開しています。 → https://github.com/akih1992/qiita/tree/master/rl/generalized_hanoi 一般化ハノイの塔について ここでは、ポール数を増やしたハノイの塔を一般化ハノイの塔と呼ぶことにします。ポールが増えた場合、3本のときよりも短手順で求解できるのは明らかですが、最短手順はどうなるのでしょうか。本記事ではこの最短手順を考えます。 ※導出方法を考えるにあたり、一般化ハノイの塔についてまとめているこのWebページ2
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く