エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
DCNNを使った強化学習の特性と限界 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
DCNNを使った強化学習の特性と限界 - Qiita
要点 DCNNは局所的な特徴を大量に記憶する仕組み 「人間が論理構造を把握できる問題」ならば「DCNN+強... 要点 DCNNは局所的な特徴を大量に記憶する仕組み 「人間が論理構造を把握できる問題」ならば「DCNN+強化学習」の利用価値は低い。 「局所的な特徴だけで判断できない問題」ならば「DCNN+強化学習」の性能は低い。 「多様な訓練データを作成できない」ならば「DCNN+強化学習」の性能は低い。 Alpha Go Zeroの成功は色々な条件と工夫の結果であり、Alpha Zero方式は万能ではない。 はじめに 2018年3月頃から、いくつかのゲームAIのコンペティションに参加するため、DCNN(Deep Convolutional Neural Network)を使った強化学習プログラムを作っていました。成功したものもあれば失敗したものもあり、それらの経験からDCNNを使った強化学習の特性みたいなものも見えてきたので、そのあたりをまとめます。 プログラムの作り方については、特に解説していません