このブラウザーはサポートされなくなりました。 Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカル サポートを利用できます。 2018 年 11 月 Volume 33 Number 11 人工知能 - 強化学習の詳細 Frank La La 先月のコラムでは強化学習 (RL) のいくつかの基本的な概念について取り上げました。簡単な環境を使用した厳密にランダムな方法、そして、過去の行動を記憶して、どの行動が報酬を引き出すかを覚え込ませる Q テーブルを実装する方法を試しました。デモでは、ランダムに動作するエージェントは対象回数のうち約 1% が目標の状態に達することができ、過去の行動を記憶させた Q テーブルを使用すると全体の回数の約半数で目標の状態に達することができました。ただし、この実験は、RL の有望で拡張可能な分野のほんの表
![人工知能 - 強化学習の詳細](https://cdn-ak-scissors.b.st-hatena.com/image/square/82e6564e92b1828f860a7d892b895a946b3eb2ea/height=288;version=1;width=512/https%3A%2F%2Flearn.microsoft.com%2Fen-us%2Fmedia%2Flogos%2Flogo-ms-social.png)