タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

tensorflowと強化学習に関するyahihiのブックマーク (1)

  • Google、TensorFlowベースの強化学習フレームワーク「Dopamine」を公開 | OSDN Magazine

    Googleは8月27日、強化学習研究のためのフレームワーク「Dopamine」をオープンソースで公開した。強化学習アルゴリズムのプロトタイプを高速に実装できるという。 強化学習は入力に対する「報酬」が最大になるような行動を学習によって決定する手法。人間の囲碁棋士に勝利したGoogle DeepMindの囲碁ソフトウェア「Alpha Go」などで採用されている機械学習手法の1つ。 Googleによると、強化学習の課題として既存の強化学習フレームワークは研究者が効果的にイテレーションするのに十分な柔軟性と安全性がなく、新しい研究の方向性を探ることが難しいという問題があるという。また、既存のフレームワークからの結果の再現も時間がかかるという。 Dopamineは機械学習ライブラリのTensorFlowを土台としたオープンソースの強化学習フレームワーク。ベンチマークテストを簡単に実行できる、新し

    Google、TensorFlowベースの強化学習フレームワーク「Dopamine」を公開 | OSDN Magazine
  • 1