[B! Qiita][TSP] ni66lingのブックマーク

ni66ling id:ni66ling

QiitaとTSPに関するni66lingのブックマーク (1)

巡回セールスマン問題を深層強化学習で解いてみる - Qiita
強化学習はデータ探索の試行錯誤を伴うため、達成精度に対する必要データ量の効率は悪くなる傾向にあります。一方、性質の良くない系列（不正解）も含めて様々な詳細パターンを経験するため、最終的にはより豊富な表現が得られる可能性も秘めています。実際、参照論文では、元の教師ありの結果と比較し、より良い性能を発揮したことが報告されています。一方、強化学習の大きなメリットは、ルールや達成したい目的のみから、supervisionやドメイン知識無しで自律的に学習を進めることができる点です。この論文のアプローチは、Alpha Go Zero3のように、ヒューリスティクスに準ずる（もしくは置き換わる）ような組合せ生成パターンを、ルールのみからスクラッチ学習しようという精力的な試みとなっています。以上から推察される通り、本アプローチの適用ケースとしては - ヒューリスティクスが与えにくいような条件が複雑な難しい
ni66ling 2021/02/11
巡回セールスマン問題

TSP

Qiita

強化学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx