[B! DeepLearning][techfeed] slay-tのブックマーク

slay-t id:slay-t

DeepLearningとtechfeedに関するslay-tのブックマーク (3)

嘘だろ?深層学習が3Dゲームを再現｜shi3z｜note
深層学習の世界では時折・・・と言っても、一ヶ月に一回くらいだが・・・信じられないようなことが起きる。以前、ゲーム画面を見ただけでパックマンやらマリオやらを再現するAIが出現したと聞いたとき、「嘘だろ」と思ったのだが、まあ言うてパックマン。なんとなくできるのかもしれない。しかしこの手のものはあまりにも直感に反するので自分の手で確かめないと本当かどうかわからない。そんな時のために僕の仕事机には7台のGPUマシンがあるわけだが、たまたまRTXが遊んでいたので実行してみたら、「嘘だろ」としか言いようがない結果を目の当たりにすることになった。 GTAVこと「グランセフトオートV」は、自動車泥棒になって架空の街を走り回るゲームだ。こいつをひたすらAIに学習させると、GTAVをAIが再現するという、全く直感に反することが行われるらしい。3Dゲームというのは、それを作った経験のある人なら誰でも、恐
slay-t 2021/06/28
学習

self

ゲーム

機械学習

勉強

AI

deeplearning

techfeed
リンク
DEEP LEARNING · Deep Learning
Description This course concerns the latest techniques in deep learning and representation learning, focusing on supervised and unsupervised deep learning, embedding methods, metric learning, convolutional and recurrent nets, with applications to computer vision, natural language understanding, and speech recognition. The prerequisites include: DS-GA 1001 Intro to Data Science or a graduate-level
slay-t 2021/02/08
学習

Deep Learning

機械学習

deeplearning

techfeed

machinelearning

lecture

深層学習
リンク
【入門】強化学習 - Qiita
強化学習をざっと勉強した際のまとめです。入門者の参考となれば幸いです。強化学習とは強化学習の位置付けはこのようになります。【用語】 - 教師あり学習 - 教師データとして入力とその出力がある - 回帰や分類問題 - 教師なし学習 - 教師データがない - データの特徴を抽出したり、表現変換強化学習では何をしていくかというと、「将来の価値を最大化するような行動を学習」していきます。強化学習のモデル強化学習の基本的な仕組みは次のようになっています。以下の$t$は任意のステップを示しますエージェント（意思決定者）: 意思決定と学習を行う主体環境: エージェントが相互作用を行う対象状態: 環境がエージェントの行動を反映した上で、エージェントに与える状況, $s_t$ 行動: $a_t$ 報酬: $r_t$ 方策: $π_t(s, a)$:確率分布で表される行動戦略。任意の
slay-t 2020/05/18
学習

qiita

入門

機械学習

deeplearning

機械学習系読物

HotEntry

techfeed
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx