[B! *algorithm][contest][rl] sh19910711のブックマーク

sh19910711 id:sh19910711

*algorithmとcontestとrlに関するsh19910711のブックマーク (1)

分散深層強化学習ライブラリHandyRLをコンペで使ってみた。 - のんびりしているエンジニアの日記
皆さんこんにちはお元気ですか。ブログ書きながら、当チームのガチョウを見守っています。最近までHungryGeeseに参加しており、このコンペでHandyRLライブラリには大変お世話になりました。このコンペでHandyRLを改造して使ったので、そのポイントを記録として残しておきます。 HandyRLとは HandyRLの使い方基本編 Tips 自己対戦以外でエージェント作成様々なエージェントで評価自己対戦モデルを一定期間保存する学習済モデルの実行決定的動作で動かす感想 HandyRLとは一言で言えば、PyTorchで利用できる軽量な深層分散強化学習用のフレームワークです。実際に使ってみた感想としても、これまでの強化学習のFWより直感的に理解しやすいものでした。 github.com 分散深層強化学習ではこの2つの処理を同時に行っています。 1. エージェントを自己対戦さ
sh19910711 2021/08/10
"PyTorchで利用できる軽量な深層分散強化学習用のフレームワーク / 今まで強化学習を行うとなれば、複雑なライブラリや実装を読み解く必要があり / これまでの強化学習のFWより直感的に理解しやすい"

*algorithm

contest

機械学習

rl

python
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx