エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
強化学習で迷路を解く - 小宮日記
強化学習で迷路を解く ↑ これは解りやすい。Javaでグラフィカルに見れる。 ソースとか説明はないので、... 強化学習で迷路を解く ↑ これは解りやすい。Javaでグラフィカルに見れる。 ソースとか説明はないので、想像すると、 迷路をスライムが初めはランダムにゴールを目指すけど、 たまたまゴールにたどり着くと、歩いた経路に+1で報酬をつけるんでしょう。 これを繰り返すと、 ゴールに行けた経路のうち重複したマスは報酬が積み重なる。 あとは、なるべく報酬が積み重なったマスを移動するようにすれば 迷路の経路を学習して最短経路で進めるようになる。 粘菌で迷路を解くのと似ている。ただ、粘菌は一人ではなく、複数の経路に 同時に枝を伸ばす。そこが並列処理になっている。 このサンプルはスライムは1匹だけど、本来、何匹もいてもいい。 とか考えると、スライムの報酬は、アリのフェロモンと同じだ。 アリは並列処理でエサを探し、フェロモンで同期をとっている。 自然はなんと賢いのだろう。