There has been a recent explosion in the capabilities of game-playing artificial intelligence. Many classes of RL tasks, from Atari games to motor control to board games, are now solvable by fairly generic algorithms, based on deep learning, that learn to play from experience with minimal knowledge of the specific domain of interest. In this work, we will investigate the performance of these metho
GitHub にある DingKe/qrnn/ の サンプルコード imbd_qrnn.py https://github.com/DingKe/qrnn/ は、 from keras.datasets import imdb で、kerasの組み込みデータセット imdb を 読み込んで いる。 このデータは、以下 の 公式解説 に よる と、 Keras Documentation データセット 「IMDB映画レビュー感情分類」 IMDB映画レビュー感情分類 感情(肯定/否定)のラベル付けをされた、25,000のIMDB映画レビューのデータセット。レビューは前処理済みで、各レビューは単語のインデックス(整数値)のシーケンスとしてエンコードされている。便宜上、単語はデータセットにおいての出現頻度によってインデックスされている。そのため例えば、整数値"3"はデータの中で3番目に頻度が多い単
書きました https://t.co/m4YhZolDjD — mooopan (@mooopan) February 20, 2017 ということでChainerの強化学習版ChainerRLが公開されていました。 このところ手を広げすぎていて中々丁寧な仕事ができない中、 30分 x 2日でDouble DQNでライントレーサーできました。ライブラリ便利で助かる! 使用環境 Windows 10 - 64bit <諦めが悪い心の強さ…!> Python 3.6.0 |Anaconda 4.3.0 (64-bit) <プライドより実利!> ChainerRL 0.2 < Dependency緩くしてほしい> Chainer 1.19 <1.20でTheanoのお世話できてない!会社ではTheano動いたのに。>
デブサミ2017たくさんのご参加ありがとうございました。もう中の人を卒業して、ばあやぐらいしか参戦していない私がお礼をいうのも何なんですが、来ていただいた方々、皆様お楽しみいただけたでしょうか?これからのご自身の活力アップのネタ、仕込めましたでしょうか? さて、私自身、今回とても心動かされたセッションがありました。それは、ITエンジニア本大賞のプレゼン大会です。このアワードの中の人ではあるのですが、とてもとてもすごく感動したので、この思いを忘れないためにblogをしたためてみようと思います。 まず、ITエンジニア本大賞って何っていう方にご説明すると、ITエンジニアのみなさんが、ITエンジニアにオススメしたい本を投票していただきます。その中のビジネス書、技術書で上位3冊のプレゼン大会をデブサミでやります。プレゼン大会に聴講していただいた方の投票結果で、ビジネス書大賞、技術書大賞を決めるもので
Chainerを使った深層強化学習ライブラリChainerRLを公開しました. https://github.com/pfnet/chainerrl PFNエンジニアの藤田です.社内でChainerを使って実装していた深層強化学習アルゴリズムを”ChainerRL”というライブラリとしてまとめて公開しました.RLはReinforcement Learning(強化学習)の略です.以下のような最近の深層強化学習アルゴリズムを共通のインタフェースで使えるよう実装してまとめています. Deep Q-Network (Mnih et al., 2015) Double DQN (Hasselt et al., 2016) Normalized Advantage Function (Gu et al., 2016) (Persistent) Advantage Learning (Bellemar
オーソドックス な アプローチ(一般的手法) まず は、以下 が よくまとまっている。 株式会社クロスコンパス・インテリジェンス(2016.10.5)「NVIDIA GPU TECHNOLOGY CONFERENCE JAPAN 2016 Industry Deep Learning」 異常値予測 を 行う アプローチ としては、以下 が 一般的な考え方 の ようだ。 (データ量の多い)正常時のデータ挙動の特徴パターンを学ばせて、 新規データが上記の特徴パターンから乖離している場合を、異常とみなす 上記のアプローチをとる理由 は、「異常発生時のデータ」の取得可能件数 は、「正常時のデータ」 に 比べて、取得できるデータの件数 が 圧倒的に少ない から である。 上記のスライド で 挙げられている AutoEncoderモデル や LSTMモデル を 採用し、 AutoEncoderモデル
Applications DeepFix: A Fully Convolutional Neural Network for predicting Human Eye Fixations arxiv: http://arxiv.org/abs/1510.02927 Some like it hot - visual guidance for preference prediction arxiv: http://arxiv.org/abs/1510.07867 demo: http://howhot.io/ Deep Learning Algorithms with Applications to Video Analytics for A Smart City: A Survey arxiv: http://arxiv.org/abs/1512.03131 Deep Relative A
どうも吉田悠一です. 弊社の近藤がNIPS2016のWorkshopで発表したDemitasseをオープンソースで公開します. “Satoshi Kondo, “Demitasse: SPMD Programing Implementation of Deep Neural Network Library for Mobile Devices”, ML Systems Workshop NIPS 2016 PDF” https://github.com/DensoITLab/Demitasse llvmとispcを使い,Deep Learningの計算を高速化します. Demitasseによれば,iOSデバイス上でもGPUを使わずに数百msecの時間で,Caffe Model Zooによる画像認識を実行することができます. ビルド方法は,githubのリポジトリのドキュメントに書いてありま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く