
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
d3rlpy: オフライン強化学習ライブラリ - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
d3rlpy: オフライン強化学習ライブラリ - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure y... Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 本記事は自分が開発している深層強化学習ライブラリ「d3rlpy」の紹介記事です. d3rlpyとは? d3rlpyは2020年度未踏IT人材発掘・育成事業に採択されて開発を始めた深層強化学習ライブラリです.未踏事業後の現在でもプライベートで開発を続けています. d3rlpyの最大の特徴は「オフライン強化学習」というパラダイムを手厚くサポートしている点です.後述しますが,オフライン強化学習は事前に用意されたデータセットを使って強化学習を行うことができるので,ロボットや医療系のドメインなどの探索的に環境とインタラクションすることが困難な用途