CLSmoothのブックマーク / 2024年11月25日

実装から始めるはじめての強化学習

どうもこんにちは。積読した書籍が700冊を突破しました、connectome.design のアプリケーションエンジニアの康です。最近では、会社の Zenn ブログに記事を書く機会を得られたため、ようやく長らく積んでいた強化学習の書籍に手を伸ばし、初歩的な勉強を始めました。この記事では、強化学習の実装に重点を置き、解決する問題を極力単純化にして、強化学習に対しての理解を深めたいと考えております。はじめに強化学習は、機械学習の手法の一つであり、目的である収益の最大化を達成するため、状態に応じて適切な行動を選択する方策（Policy）を求めています。その中にも、複数の手法がありますが、ここでは強化学習の手法の一つである、 Q 学習を利用し、実際に問題を解かせてみました。そして、今回の問題は用意した数列に含む数字を推測させることです。内容は以下になります。事前に数列の要素である数

はてなブックマーク

タグ

2024年11月25日のブックマーク (1件)

実装から始めるはじめての強化学習

お知らせ

今週のはてなブックマーク数ランキング（2026年5月第1週）

月間はてなブックマーク数ランキング（2026年4月）

今週のはてなブックマーク数ランキング（2026年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス