[B! deepmind] muddydixonのブックマーク

muddydixon id:muddydixon

deepmindに関するmuddydixonのブックマーク (2)

33122
Google「DeepMind」、コンピュータが人型ベースでB地点にたどり着く最善の方法（柔軟な動き）を独学で生成する強化学習を用いたアプローチを提案した論文を発表 2017-07-11 GoogleのAIを研究する子会社「DeepMind」は、強化学習で人型含めシミュレートされた環境の中で複雑で柔軟な動きを生成するアプローチを提案した論文を公開しました。 Emergence of Locomotion Behaviours in Rich Environments（PDF）これら動きは、コンピュータが独学で最善の方法として考案した行動です。研究者は、エージェントに動きのセットと前進するインセンティブを与え、AからB地点にたどり着く最善の方法を生み出すための強化学習を仕込みます。コンピュータは、今ある動作を使って試行錯誤を繰り返し、さまざまな動き方を思いつく中で次々と最善へ近づけてい
muddydixon 2017/07/11
こういう走り方する人いるよね

deepmind

simulation

ai
リンク
DeepMindが自然言語理解の２難題を解決した - mabonki0725の日記
ランニングできず　英語30分 The Boune Leagacy (1) DeepMindの自然言語を理解するUNREALモデルの論文を読み、深い感動を覚える。このモデルは自然言語理解に於ける２つの懸案事項を解決している。・計算機が言語を教える事を可能にした。言語理解で正解すれば計算機がエージェントに報酬を与えることで、数十万の繰り返し学習を可能にした。従来は人間が計算機に教えるしかなく、試行回数の壁があった。・複雑な文章理解では、単純な文章学習を経ていけば可能になることを実証した DeepMindの証明したかったことは以上の3点である・言語理解を解明するには、人間の環境に似た３要素の模擬環境が必要・動作できるエージェント・エージェントが存在する３D環境・報酬と罰則・言語学習には相当な繰り返しが必要・複雑理解では適切な学習手順が必要
muddydixon 2017/07/10
machinelearning

nlp

comprehension

deepmind
リンク
1