[B! OpenAI] t_furuのブックマーク

t_furu id:t_furu

OpenAIに関するt_furuのブックマーク (2)

OpenAI、失敗を成功に置き換えて学習する強化学習アルゴリズム「HER」発表
OpenAIは、失敗から学ぶ強化学習アルゴリズム「HER（Hindsight Experience Replay）」と、そのアルゴリズムを使用して物理ロボットで動作するモデルを訓練するための8つのシミュレートされたロボット環境を発表しました。訓練するロボット環境には、Fetch researchプラットフォームとShadowHandロボットが含まれます。ロボットアームが物体を操作するいくつかのタスクが用意されており、どれも目標であるゴールが設定されゴールに向かって動作します。例えば、以下の画像は、黒のパックを押すように弾いて赤丸（ゴール）に停止させるというタスクが行われます。 HERの特徴は、仮にゴールと違う場所に黒パックが停止した場合でも、それはそれで成功と置き換えて学習します。違う場所へ黒パックがスライドしたとしても、そこをバーチャルゴールとして再設定することで今後へ生かすと。も
t_furu 2018/02/28
強化学習

ロボット

OpenAI
リンク
機械学習関連ニュース2016
piqcy @icoxfog417 言語モデルのタスクで、CNNでLSTM同等以上の精度を出したという話。畳み込んだ結果をGRUに近い機構で処理し、過去の情報が消失しないようにしている。Google Billion Wordのデータセットでは、LSTMと同等の精度を出す一方計算効率が20倍程度改善された。 twitter.com/Smerity/status… 2017-01-01 13:23:09 Smerity @Smerity Gated Convolutional Networks beat LSTM on LM (WikiText-103 & One Billion LM for single GPU), faster than CuDNN LSTM arxiv.org/abs/1612.08083 pic.twitter.com/UBplrTjEAv 2016-12-26 15
t_furu 2016/05/09
TensorFlow

機械学習

microsoft

CNN

OpenAI

python

TensorFlow
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx