エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
強化学習
名前からして強化できそうな学習方法ですがそうではありません(笑) 学習には大きく分けて3つあります。 ... 名前からして強化できそうな学習方法ですがそうではありません(笑) 学習には大きく分けて3つあります。 教師あり学習 問題と解答を教えてもらいながら学習します。 学校での授業のような感じの学習です。 ニューラルネットワークなどが当てはまります。 教師なし学習 データだけを受けとりもっともらしく分類したりします。 データにはラベル(教師)がついていません。 クラスター分析などが当てはまります。 強化学習 いろいろ行動が取れる空間に放り投げ出されます。 どんな行動をとったらいいかはわかりません。 でも行動をとると褒められたり怒られたりします。 そしてできるだけいっぱい褒めてもらおうとします。 強化学習の特徴は 問題の答(最善の行動)は指定しなくてかまいません。 行動に対して報酬を設定します(取って欲しい行動に報酬を多く)。 エージェント(行動を取る何か)は多くの報酬を