タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

*algorithmとcontestとrlに関するsh19910711のブックマーク (1)

  • 分散深層強化学習ライブラリHandyRLをコンペで使ってみた。 - のんびりしているエンジニアの日記

    皆さんこんにちは お元気ですか。ブログ書きながら、当チームのガチョウを見守っています。 最近までHungryGeeseに参加しており、このコンペでHandyRLライブラリには大変お世話になりました。 このコンペでHandyRLを改造して使ったので、そのポイントを記録として残しておきます。 HandyRLとは HandyRLの使い方 基編 Tips 自己対戦以外でエージェント作成 様々なエージェントで評価 自己対戦モデルを一定期間保存する 学習済モデルの実行 決定的動作で動かす 感想 HandyRLとは 一言で言えば、PyTorchで利用できる軽量な深層分散強化学習用のフレームワークです。 実際に使ってみた感想としても、これまでの強化学習のFWより直感的に理解しやすいものでした。 github.com 分散深層強化学習ではこの2つの処理を同時に行っています。 1. エージェントを自己対戦さ

    分散深層強化学習ライブラリHandyRLをコンペで使ってみた。 - のんびりしているエンジニアの日記
    sh19910711
    sh19910711 2021/08/10
    "PyTorchで利用できる軽量な深層分散強化学習用のフレームワーク / 今まで強化学習を行うとなれば、複雑なライブラリや実装を読み解く必要があり / これまでの強化学習のFWより直感的に理解しやすい"
  • 1