エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
機械学習するロボットにギャンブルをやらせてみた - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
機械学習するロボットにギャンブルをやらせてみた - Qiita
概要 動機 最近、機械学習と深層学習という本を読み、「じゃあ、機械にギャンブルをやらせてみたらどう... 概要 動機 最近、機械学習と深層学習という本を読み、「じゃあ、機械にギャンブルをやらせてみたらどうなるんだろう?」と発想したのがきっかけ。 手法 今回は「どれだけお金をつぎ込んだらどれだけ儲かるまたは損をする」を学習させてみたいので、強化学習の一種でありサンプルプログラムが載っていた『Q学習』を用いた。 結論 機械であっても期待値的には損をする行動もとるようになるらしい。 Q学習とは何なのか 経路Qに対して報酬が与えられ、その報酬の多寡で学習を進めていく手法。 サンプルプログラム 本に載っていたサンプルプログラムはCで書かれていたが、今更Cも何なのでRubyで書き換えた。本当はPythonなのかもしれないが、外部ライブラリを使っているわけでもなし、特別複雑な計算をしているわけでもなしで、Rubyでも大丈夫だと判断。 ただし、関数selectaの中身はサンプルのデータ構造にものすごく依存した

