Terrain-Adaptive Locomotion Skills Using Deep Reinforcement Learning Transactions on Graphics (Proc. ACM SIGGRAPH 2016) (to appear) Xue Bin Peng Glen Berseth Michiel van de Panne University of British Columbia Reinforcement learning offers a promising methodology for developing skills for simulated characters, but typically requires working with sparse hand-crafted features. Building on re
This is a sequel to my previous post several months ago. Last time, I introduced a shoddy library named deeplearn-rs that allowed you to build and (manually) train neural networks that run on your GPU via OpenCL. I told you to “take a gander” at some atrocious code that constructed a rather useless XOR network and then didn’t bother to train it. For reasons unknown, I still got positive feedback.
前にDQNの再現の記事を書いてからほぼ1年が空いてしまいました.DQNの新しい論文が2月にNatureに載ったのは記憶に新しいですが,それから研究はさらに加速し,最近では自分の感覚としてはarxiv含めて平均すると1週間に1論文くらいのペースで深層強化学習の研究が発表されているのではないかと思います(ちゃんと計算してないので全然違ってたらすみません). これだけ論文が増えるとまとめのようなものが欲しくなるので,自分で作ることにしました. https://github.com/muupan/deep-reinforcement-learning-papers まだだいぶ不完全ですし,論文リストをきちんとした形で作るのははじめてなのでいろいろと迷う部分があるのですが,これから少しずつ充実させていく予定です.
Which is not to say that our digital assistants will never live up to their simulated humanity. So many researchers working at so many tech giants, startups, and universities are pushing computers towards true natural language understanding. And the state-of-the-art keeps getting better, thanks in large part to deep neural networks---networks of hardware and software that mimic the web of neurons
The Deep Scalable Sparse Tensor Network Engine (DSSTNE) library is now available under the Apache 2.0 license. Following the lead of other tech giants, Amazon has open sourced its deep learning software. The Deep Scalable Sparse Tensor Network Engine (DSSTNE) library is now available on GitHub under the Apache 2.0 license. Amazon explained on its FAQ page that DSSTNE, pronounced "Destiny," helps A
光センサがコースを検知したら左曲がりに進行、検知しなかったら右回りに進行、という味気ないやつ 青色 僕らの期待の新星DQN 入力:[[光センサの検知/不検知][前回とった行動]]を1セットに過去5個分 : 20次元 隠れ層:50ユニット x 2枚ほど <実は前の記事で隠れ層が1枚なのに2枚と勘違いしてました> 出力:左曲がり進行、直進、右曲がり進行 ご褒美:コースから5px以内 +1ポイント 10px以内 +0.5ポイント 壁際2px以内 -1ポイント そして、壁にぶつかったら張り付き続けてしまい学習時間に支障が出そうになるのでコース上に位置リセット。 現状の状況 いくら直近の過去のことを覚えていても自分の位置もわからない一つ目お化けじゃ迷子になる様子? せめて2つ以上センサーがあるようなライントレーサーにしたり、自分の位置を計算したりするなど何らかの手段で、自分とコースの位置関係を把握で
講演テーマ:「Convolutional Neural Network 入門講座」 講 演 :丸山不二夫 開催日時:2016年5月13日(金) 19:00 ~ 21:00 開場:18:30 、 受付:18:30 ~ 19:30 会 場 :TIS株式会社 東京本社 14F 研修室 (西新宿) 受講チケット申込: 5月6日(金)12:00~5月13日(金)10:00、このページから。 講演の狙い ニューラル・ネットワーク技術の中核としてのCNN ニューラル・ネットワークに関心を持っている人が増えています。僕は、こうした意欲的な人たちに、是非、CNN(Convolutional Neural Network) を理解してもらいたいと思っています。CNNは、現在のニューラル・ネットワークの中心的な技術で、かつ、もっとも大きな成果を上げている技術の一つだからです。あのGoogleのAlphaGoも
LightNet is a lightweight, versatile and purely Matlab-based deep learning framework. The idea underlying its design is to provide an easy-to-understand, easy-to-use and efficient computational platform for deep learning research. The implemented framework supports major deep learning architectures such as Multilayer Perceptron Networks (MLP), Convolutional Neural Networks (CNN) and Recurrent Neur
こんにちは 本業はプログラマじゃない人です。 テレビで「ディープラーニング」というキーワードがバズっているときに、 分散深層強化学習でロボット制御 | Preferred Researchを見て、 試してみたいことが出てきたので、いきなりクローンとは言わず、まず簡単なものから作った。 ⇒ 置き場:DeepQNetworkTest 狙い Pythonも初めて!Chainerも初めて! プログラミングの作法すら分からないのに周囲にソフト屋さんがいない! でも、自走機械に強化学習というのをやらせてみたい! ⇒ とりあえず公開すれば教えてくれる人が出てくるかもしれない 慣性とか持っている機械を動かして見せてる事例が本当に少ない(気がする) ⇒ 次のステップで入れてみよう やったこと ConvNetJS Deep Q Learning Reinforcement Learning with Neur
==================================================================== 本セミナーでは,講演者の方が使用する資料を当日CDなどの外部記憶媒体で回し, 各自ご持参いただいたPCにコピーしていただけるようにいたします. 資料を希望される方は,PCをご持参ください. ==================================================================== 概要 Deep Learning技術は,画像認識・音声認識分野等において盛んに研究がなされており,飛躍的な性能改善が報告されております.自然言語処理分野でもDeep Learning技術を用いた研究が報告されておりますが,画像・音声分野と比べて十分に普及しているとはいえない状況です.本セミナーでは,Deep Learning及び自然
イベント内容 MPS横浜 概要 MPSは、「みんなでわいわいソフトウェア作りながら技術を磨いて実績を作ろう!」をコンセプトに活動しています。プログラミング玄人とも初心者もみんなで協力して作品作りを行い、できあがった作品は共同制作のオープンソース・ソフトウェアとして、世の中に出します。 MPS横浜は「筋電位とDeep learning を用いた簡単なロボットアームを作ってみよう!」をテーマに発足しました。 前回から数回にわたって行う勉強会は、そのための Deep learning と電子回路に関する知識の実践的な獲得を目的とします。前提知識をあまり仮定せず 、基礎の基礎から学べるようにしてゆきます (高校二年生程度の数学の知識と if や for 文など Python の経験を少し仮定しますが、なくても是非チャレンジしてみてください ! )。 勉強会の後はみんなでご飯を食べにいきます ! 今
AI、ついに人類最後の砦である「Flappy Bird」をも攻略2016.05.09 09:00 渡邊徹則 もはや人類に為す術はないのか…。 囲碁において、コンピューターが人間に勝つのは「あと10年かかる」といわれていました。しかしご存じの通り、AIが世界のトッププロを破ったのはつい先日のことです。 そしておそるべきことに、AIはついに「人類最後の砦」ともいうべき激ムズゲーム「Flappy Bird」をも攻略してしまったのです。 この動画は現在、Googleが開催している学生向けの開発イベント「Google Summer of Code」に参加中のYen Chen Linさんがアップしたもの。 最強の囲碁ソフト「AlphaGo」を生み出したのは、Googleの子会社であるDeep Mind社でしたが、こちらで使われている画像認識によってゲームを攻略するAI、「DQN(Deep Q-lear
Durk Kingma Diederik P. Kingma Publications | Brief Bio | PhD Thesis | Demos | Links | Honors Publications See my Google Scholar profile for an up-to-date list. Brief Bio I'm a computer scientist and researcher, with a focus on scalable methods for machine learning and generative modeling. My contributions include the Variational Autoencoder (VAE), the Adam optimizer, Glow, and Variational Diffusi
NVIDIA DGX-1はサーバー250台分のスループットを実現し、人工知能で求められる大量コンピューティングに対応 米国カリフォルニア州サンノゼ—GPUテクノロジ・カンファレンス—2016年4月5日― NVIDIA(本社:米国カリフォルニア州サンタクララ、社長兼CEO:ジェンスン・フアン(Jen-Hsun Huang)、Nasdaq:NVDA)は本日、人工知能(AI)で要求される無制限のコンピューティングに対応する世界初のディープ・ラーニング・スーパーコンピュータ、NVIDIA® DGX-1™を初公開しました。 NVIDIA DGX-1は、ディープ・ラーニングに特化して設計された初のシステムで、ハードウェア、ディープ・ラーニング・ソフトウェア、および開発ツールを余すところなく統合し、開発を迅速かつ容易にします。このシステムはすぐに稼働可能な状態で提供され、新世代のGPUアクセラレータを搭
How many dollars is "borderline crazy"? Two years ago, as the market for the latest machine learning technology really started to heat up, Microsoft Research vice president Peter Lee said that the cost of a top AI researcher had eclipsed the cost of a top quarterback prospect in the National Football League---and he meant under regular circumstances, not when two of the most famous entrepreneurs i
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く