深層強化学習：ピクセルから『ポン』 – 後編 | POSTD

テクノロジーカテゴリーの変更を依頼記事元:

postd.cc

22 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

深層強化学習：ピクセルから『ポン』 – 後編 | POSTD

前編はこちら：深層強化学習：ピクセルから『ポン』 – 前編起こっていないことさて、方策勾配を使っ... 前編はこちら：深層強化学習：ピクセルから『ポン』 – 前編起こっていないことさて、方策勾配を使って生のピクセルから『ポン』をプレイする方法を学びましたが、ご理解いただけましたね。この手法は推測してチェックするという手間のかかるやり方で、”推測”は最新の方策からロールアウトをサンプリングすることを意味し、”チェック”は良い結果を導くアクションを促すこと意味します。大枠では、これは強化学習の問題への最先端のアプローチです。このような振る舞いを学習できるということは感動的です。しかしあなたが直感的にアルゴリズムを理解していて、どのように機能するか知っているとしたら、少しがっかりしてしまうのではないでしょうか。具体的に、機能しないのはどういうところでしょうか。これと比較して、人間は『ポン』のプレイ方法をどのように学習するでしょうか。おそらくあなたはゲームを見せ、次のように言います。「パドル

ブックマークしたユーザー

white-space2017/02/14
aidiary2017/02/13
ottonove2016/11/27
tyosuke20112016/07/21
kaz_uki_10142016/07/17
alaluta2016/07/08
kingqwert2016/06/30
agw2016/06/30
hal91112016/06/29
p_tan2016/06/29
cmd082016/06/29
wkoichi2016/06/29
manabou2016/06/29
kabukawa2016/06/28

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx