yukimori_726のブックマーク - はてなブックマーク

週末に3DSもポケモンもなかったのでChainerでDQNを育てた話。 - EnsekiTT Blog
つまりなにしたのブロック崩しなどで一世を風靡したDeep Q NetworkをChainerで実装して、OpenAIの環境で育てた。 youtu.be 基本的な強化学習の流れゲームそのものをEnvironment ゲームで言うプレイヤーをAgent プレイヤーの操作をAction プレイヤーはプレイの結果をゲーム画面を観察、つまりObservationして確認する（日本語に組み込むと変な感じゲーム画面には、ゲームの状態（残りのブロックの画像とか）、Stateが表示される。ゲーム画面には、ゲームのスコア(上がると嬉しいもの)、Rewardも表示される。プレイヤーは操作とゲーム画面の組み合わせからこれはうまくいった、うまくいく流れ来たけどなんかこれ以上スコア上がらん…大きく変えるか！とかを繰り返して学習を勧めていく。（英単語はOpenAI Gymの表現と合わせている。）基本的な
yukimori_726 2017/05/30
dqn
リンク
勤労感謝の日なのでChainerの勤労(Training)に感謝してextensionsを全部試した話 - EnsekiTT Blog
つまりなにしたの Chainerの抽象度を飛躍的に高めたTrainerにはextensionsがある。せっかくだからextensionsを全部使ってみた。 2017年11月10日追記 Extensionを自分で作ってみました。 ensekitt.hatena blog.com 背景最近やっとChainerのバージョンを上げました。 qiita.com を読んで、すごい勢いで僕のソースコードも抽象化したわけですが、僕はまだまだextensionsの素敵機能を素敵に使いこなせてない！というわけで、勤労感謝の日にChainerの勤労(Training)に感謝してextensionsを全部試した。 Trainer extensions Trainer extensions — Chainer 3.0.0 documentation dump_graph 概要グラフをDOT Languag
yukimori_726 2016/12/06
chainer

extension

evaluator

visualization
リンク
1

はてなブックマーク

タグ

ブックマーク / ensekitt.hatenablog.com (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / ensekitt.hatenablog.com (2)

週末に3DSもポケモンもなかったのでChainerでDQNを育てた話。 - EnsekiTT Blog

勤労感謝の日なのでChainerの勤労(Training)に感謝してextensionsを全部試した話 - EnsekiTT Blog

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス