※2018年06月23日追記 PyTorchを使用した最新版の内容を次の書籍にまとめました。 つくりながら学ぶ! 深層強化学習 ~PyTorchによる実践プログラミング~ 18年6月28日発売 「倒立振子(棒立て問題)」を、強化学習のQ学習、DQNおよびDDQN(Double DQN)で実装・解説したので、紹介します。 ディープラーニングのライブラリにはKerasを使用しました。 (※追記:17/09/27にHuber関数部分を修正しました) (※追記:17/10/01にQ学習更新のr抜けを修正しました) (※追記:17/10/03にQ学習報酬のrewardを修正しました) (※追記:18/05/16にDDQNのターゲットの更新方法を修正しました) (※追記:18/06/12にDQNのplayとDDQNのターゲットの更新方法を修正しました) (※追記:18/10/20にDDQNの行動選択の