Google、TensorFlowベースの強化学習フレームワーク「Dopamine」(ドーパミン)、オープンソースで公開。脳の報酬系をインスパイヤ 機械学習のアルゴリズムのひとつである「強化学習」は、コンピュータが行動を選択した結果なんらかの報酬を得るとき、選択を繰り返していくなかでできるだけ多くの報酬を得るように学習していく、というものです。 この強化学習は、プロ囲碁棋士を破った初めてのコンピュータプログラムとなった「アルファ碁」で用いられたことで一気に注目されるようになりました。 Google Brainチームは、TensorFlowをベースにした強化学習のための新しいフレームワーク「Dopamine」(ドーパミン)をオープンソースで公開しました。 Dopamineは、下記のように脳の報酬系からインスパイヤを得たと説明されています。そしてドーパミンは人間にとっての報酬系である快感に関わ
![Google、TensorFlowベースの強化学習フレームワーク「Dopamine」(ドーパミン)、オープンソースで公開。脳の報酬系をインスパイヤ](https://cdn-ak-scissors.b.st-hatena.com/image/square/4a2682794d88a41db6fadd1200ff331f53db9ac0/height=288;version=1;width=512/https%3A%2F%2Fwww.publickey1.jp%2F2018%2Fdopamine01.gif)