どうもこんにちは。 積読した書籍が700冊を突破しました、connectome.design のアプリケーションエンジニアの康です。 最近では、会社の Zenn ブログに記事を書く機会を得られたため、ようやく長らく積んでいた強化学習の書籍に手を伸ばし、初歩的な勉強を始めました。 この記事では、強化学習の実装に重点を置き、解決する問題を極力単純化にして、強化学習に対しての理解を深めたいと考えております。 はじめに 強化学習は、機械学習の手法の一つであり、目的である収益の最大化を達成するため、状態に応じて適切な行動を選択する方策(Policy)を求めています。 その中にも、複数の手法がありますが、ここでは強化学習の手法の一つである、 Q 学習を利用し、実際に問題を解かせてみました。 そして、今回の問題は用意した数列に含む数字を推測させることです。内容は以下になります。 事前に数列の要素である数

