DCNNを使った強化学習の特性と限界 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/takedarts

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

DCNNを使った強化学習の特性と限界 - Qiita

要点 DCNNは局所的な特徴を大量に記憶する仕組み「人間が論理構造を把握できる問題」ならば「DCNN＋強... 要点 DCNNは局所的な特徴を大量に記憶する仕組み「人間が論理構造を把握できる問題」ならば「DCNN＋強化学習」の利用価値は低い。「局所的な特徴だけで判断できない問題」ならば「DCNN＋強化学習」の性能は低い。「多様な訓練データを作成できない」ならば「DCNN＋強化学習」の性能は低い。 Alpha Go Zeroの成功は色々な条件と工夫の結果であり、Alpha Zero方式は万能ではない。はじめに 2018年3月頃から、いくつかのゲーム AIのコンペティションに参加するため、DCNN（Deep Convolutional Neural Network）を使った強化学習プログラムを作っていました。成功したものもあれば失敗したものもあり、それらの経験からDCNNを使った強化学習の特性みたいなものも見えてきたので、そのあたりをまとめます。プログラムの作り方については、特に解説していません

ブックマークしたユーザー

MATSUZAKI2019/04/09

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx