slay-tのブックマーク - はてなブックマーク

深層強化学習のサーベイ論文を読む - mabonki0725の日記
ランニングできず　英語できず深層強化学習のサーベイ論文を読む「DeepLearning for Video Game Playing」https://arxiv.org/abs/1708.07902 最近までのPC ゲームやテレビゲームを深層学習で解くAI 技術について網羅的に解説した論文である。従って深層学習を使っても碁や将棋の様なボードゲームは対象外となっている。下図の様な殆ど全ての深層強化学習を系統別かつ目的別に解説してあり大変な労作である。もし注目するモデルがあれば、この論文で検索すると以下のことが分る様になっている。・モデルの概要・モデルを発表した論文・考案した動機や対象としたゲーム・モデル開発が可能なプラットホーム・継承したモデルと発展先のモデル下図の様に深層学習としては2013年の偉大なDQNから全てが始まっている。しかしこのDQN前にはSuttonのSarsa
slay-t 2017/09/04
AI

deeplearning

Deep Learning

Developer
リンク
DeepMindが自然言語理解の２難題を解決した - mabonki0725の日記
ランニングできず　英語30分 The Boune Leagacy (1) DeepMindの自然言語を理解するUNREALモデルの論文を読み、深い感動を覚える。このモデルは自然言語理解に於ける２つの懸案事項を解決している。・計算機が言語を教える事を可能にした。言語理解で正解すれば計算機がエージェントに報酬を与えることで、数十万の繰り返し学習を可能にした。従来は人間が計算機に教えるしかなく、試行回数の壁があった。・複雑な文章理解では、単純な文章学習を経ていけば可能になることを実証した DeepMindの証明したかったことは以上の3点である・言語理解を解明するには、人間の環境に似た３要素の模擬環境が必要・動作できるエージェント・エージェントが存在する３D環境・報酬と罰則・言語学習には相当な繰り返しが必要・複雑理解では適切な学習手順が必要
slay-t 2017/07/10
DeepMind

Deep Learning

AI

自然言語処理
リンク
1

はてなブックマーク

タグ

ブックマーク / mabonki0725.hatenablog.com (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / mabonki0725.hatenablog.com (2)

深層強化学習のサーベイ論文を読む - mabonki0725の日記

DeepMindが自然言語理解の２難題を解決した - mabonki0725の日記

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス