強化学習で迷路を解く - 小宮日記

テクノロジーカテゴリーの変更を依頼記事元:

mkomiya.hatenadiary.org

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

強化学習で迷路を解く - 小宮日記

強化学習で迷路を解く ↑ これは解りやすい。Javaでグラフィカルに見れる。ソースとか説明はないので、... 強化学習で迷路を解く ↑ これは解りやすい。Javaでグラフィカルに見れる。ソースとか説明はないので、想像すると、迷路をスライムが初めはランダムにゴールを目指すけど、たまたまゴールにたどり着くと、歩いた経路に＋１で報酬をつけるんでしょう。これを繰り返すと、ゴールに行けた経路のうち重複したマスは報酬が積み重なる。あとは、なるべく報酬が積み重なったマスを移動するようにすれば迷路の経路を学習して最短経路で進めるようになる。粘菌で迷路を解くのと似ている。ただ、粘菌は一人ではなく、複数の経路に同時に枝を伸ばす。そこが並列処理になっている。このサンプルはスライムは１匹だけど、本来、何匹もいてもいい。とか考えると、スライムの報酬は、アリのフェロモンと同じだ。アリは並列処理でエサを探し、フェロモンで同期をとっている。自然はなんと賢いのだろう。

機械学習

ブックマークしたユーザー

download_takeshi2010/06/15

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx