![](https://cdn-ak-scissors.b.st-hatena.com/image/square/cbc1f0f7d57c0fbd7dc87d81bc07542c36a83eff/height=288;version=1;width=512/https%3A%2F%2Fcdn.qiita.com%2Fassets%2Fqiita-fb-2887e7b4aad86fd8c25cea84846f2236.png)
エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ポールを増やしたハノイの塔の求解【動的計画法、強化学習】 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
ポールを増やしたハノイの塔の求解【動的計画法、強化学習】 - Qiita
強化学習はゲームやパズルを解く機械学習の手法であり、過去記事1にて、ハノイの塔を強化学習で解く方法... 強化学習はゲームやパズルを解く機械学習の手法であり、過去記事1にて、ハノイの塔を強化学習で解く方法を検証しました。 本記事では、ポールの数を3本から4本、5本、…と増やした一般化ハノイの塔について考察します。内容は、以下の2つです。 ・動的計画法による最短手順の導出 ・強化学習による求解 ※ソースコードをGitHubに公開しています。 → https://github.com/akih1992/qiita/tree/master/rl/generalized_hanoi 一般化ハノイの塔について ここでは、ポール数を増やしたハノイの塔を一般化ハノイの塔と呼ぶことにします。ポールが増えた場合、3本のときよりも短手順で求解できるのは明らかですが、最短手順はどうなるのでしょうか。本記事ではこの最短手順を考えます。 ※導出方法を考えるにあたり、一般化ハノイの塔についてまとめているこのWebページ2