この中で、最近、強化学習が注目されています。 強化学習がなぜ注目されているのか 強化学習では機械が試行錯誤を行い、自ら良い行動を学習する 教師あり学習が典型例となりますが、従来の機械学習では「まずデータを収集しましょう」からスタートとなります。データを持っていないと機械に学習させることができず、多くの企業、団体、個人にとって参入障壁になります。そのため、「データを持っていること」がビジネス上の重要な価値となっていました。 一方で、強化学習は**「十分なデータの収集が困難な状況において、どのようにデータを収集するか」**を対象とした学問体系です。データを持っていない場合においても、ビジネスチャンスを掴むことができるかもしれず、また従来の機械学習よりも良い性能が実現できるケースあり、近年、注目されています。 どういう問題を解決するか? 一つ一つの行動の正解値は不明 最終的な正解は判別可能 例え