タグ

強化学習とkerasに関するtsu-neraのブックマーク (3)

  • Home - Ike-ON

    Unlock Your Potential: Top 10 Reasons to Learn Python Python is one of the most popular programming languages in the world. As technology advances and more companies use Python … Read More C# course from scratch for beginners If you have only a general idea of what programming is and have never been professionally engaged in it, we recommend that you start learning from the very basics. Read More

  • [Python] Keras-RLで簡単に強化学習(DQN)を試す - Qiita

    はじめに 強化学習を試してみたい題材はあるけど、自分でアルゴリズムを実装するのは・・・という方向けに、 オリジナルの題材の環境を用意し、keras-rlで強化学習するまでの流れを説明します。 実行時の環境 Python 3.5 keras 1.2.0 keras-rl 0.2.0rc1 Jupyter notebook 使用するライブラリ keras 簡単にネットワークが構築できると話題のディープラーニングのフレームワークです。 keras-rl kerasを利用して、DQNなどの深層強化学習のアルゴリズムを実装したライブラリです。 対応しているアルゴリズムはこちらを参照。 gitのリポジトリをcloneしてインストールします。

    [Python] Keras-RLで簡単に強化学習(DQN)を試す - Qiita
  • Deep Q-LearningでFXしてみた - GMOインターネットグループ グループ研究開発本部

    次世代システム研究室のJK(男)です。よろしくお願いします。 今回はDeep Q-Learningという手法でFXをやってみたので紹介します。前回のブログでは、LSTMというディープラーニング(Deep Learning; 深層学習とも)の一種を使って、株価変動の予想をしました。これは「教師あり学習」という手法で、コンピュータに常に「正解」を教えて学習させます。でも、よくよく考えると金融商品って時間変動の予想が最終目標じゃないですよね。最終目標は(基的に)金融商品の売買で儲けること。つまり予想を元に、いま売るのか、買うのか、何もしないのか、という「行動」を決めることです。完全に未来がわかるのでもない限り、この行動に「正解」が無いことがわかります。 完全に予想するのは無理(短期的には買ったり負けたり)かもしれませんが、長期的には儲けるような「方針」は立てられるかもしれない。このように「方針

    Deep Q-LearningでFXしてみた - GMOインターネットグループ グループ研究開発本部
  • 1