[B! 強化学習] phoopeのブックマーク

phoope id:phoope

強化学習に関するphoopeのブックマーク (2)

これさえ読めばすぐに理解できる強化学習の導入と実践
強化学習の位置づけ教師あり学習教師なし学習強化学習強化学習の応用事例 Atariの攻略 Alpha Go ロボットの自動動作獲得ファイナンスへの応用広告配信の最適化 OpenAI Gymを使ってQ-learningを実装してみる状態行動報酬実装参考文献ディープラーニングなどの機械学習技術の進歩によって、過去のデータから学習する技術は大きく進化し、写真の中に写っている対象を認識することや病気の診断、多言語間の翻訳をする性能を著しく向上させることができました。すでにその性能は専門的な教育を受けた人間の能力と同等 [1] か超えている分野もあるほどです。一方で、人間にはデータを与えなくとも自ら経験から学び、スキルを上達させることができます。特に何も教えられなくとも、経験からゲームを攻略することやロボットの正しい動作の仕方を学んでいくことができます。機械学習の中でも、こ
phoope 2017/08/12
AI

強化学習
リンク
深層学習と並ぶ人工知能の巨塔、強化学習とは一体何か - HELLO CYBERNETICS
学習の種類教師あり学習教師なし学習半教師あり学習強化学習ハッキリとした答えがわからない良さそうか悪そうかの判断方法自体もわからない問題設定は遥かに複雑強化学習を理解する特殊例強化学習の難しさと課題点ｎ本腕バンディット問題問題の状況行動の価値知識利用と探査行動価値関数と行動の決定 Q関数貪欲法による行動の選択ソフトマックス行動選択最後に行動価値関数に関する続編記事強化学習を学ぶための書籍２０１６年NIPSでも強化学習は話題だった学習の種類教師あり学習教師あり学習では、入力データとそれに対する解答をセットでシステムに与えます。システムにデータを入力すると、何らかの出力を行います。もしもその出力が解答と違っていれば、システムの出力の仕方を僅かに変更するという形で学習を進めていきます。システムの出力をデータを解答をシステムの出力と解答との違い
phoope 2017/07/25
ディープラーニング

強化学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx