サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
Wikipedia
muupan.hatenadiary.org
前にDQNの再現の記事を書いてからほぼ1年が空いてしまいました.DQNの新しい論文が2月にNatureに載ったのは記憶に新しいですが,それから研究はさらに加速し,最近では自分の感覚としてはarxiv含めて平均すると1週間に1論文くらいのペースで深層強化学習の研究が発表されているのではないかと思います(ちゃんと計算してないので全然違ってたらすみません). これだけ論文が増えるとまとめのようなものが欲しくなるので,自分で作ることにしました. https://github.com/muupan/deep-reinforcement-learning-papers まだだいぶ不完全ですし,論文リストをきちんとした形で作るのははじめてなのでいろいろと迷う部分があるのですが,これから少しずつ充実させていく予定です.
概要 深層学習フレームワークCaffeを使って,Deep Q-Networkという深層強化学習アルゴリズムをC++で実装して,Atari 2600のゲームをプレイさせてみました. Deep Q-Network Deep Q-Network(以下DQN)は,2013年のNIPSのDeep Learning Workshopの"Playing Atari with Deep Reinforcement Learning"という論文で提案されたアルゴリズムで,行動価値関数Q(s,a)を深層ニューラルネットワークにより近似するという,近年の深層学習の研究成果を強化学習に活かしたものです.Atari 2600のゲームに適用され,既存手法を圧倒するとともに一部のゲームでは人間のエキスパートを上回るスコアを達成しています.論文の著者らは今年Googleに買収されたDeepMindの研究者です. NIPS
概要 あるサーバ上でC++11の機能をフルに使いたかったがGCCが古かったのでGCC 4.8.2を新たにインストールした.管理者権限が無いのでソースからコンパイルして$HOME/localにインストールした. 環境 OS Linux x86_64 元のGCC 4.3.2 手順 # Download GCC 4.8.2 wget http://ftp.tsukuba.wide.ad.jp/software/gcc/releases/gcc-4.8.2/gcc-4.8.2.tar.bz2 tar xjf gcc-4.8.2.tar.bz2 cd gcc-4.8.2 # Download GMP 5.1.3 wget https://ftp.gnu.org/gnu/gmp/gmp-5.1.3.tar.bz2 tar xjf gmp-5.1.3.tar.bz2 mv gmp-5.1.3 gmp #
Caffeとは CaffeはBerkeley Vision and Learning Centerというところが中心となって開発している深層学習(Deep learning)フレームワークです.公式サイトの記述によれば 速い("We believe that Caffe is the fastest CNN implementation available") GPU(CUDA)を利用できるがCPUだけでも動く きれいなアーキテクチャ&読みやすく改変しやすい実装(C++) コマンドライン,Python,MATLABインタフェースを提供 活発なコミュニティ(Githubのレポジトリやメーリングリストを見るとわかる) といった特徴があるようです.ちょうどC++から簡単に使える深層学習ライブラリを探していたところ,なんだか流行っていて(Caffeで手軽に画像分類 - Yahoo! JAPAN T
rpm -ql (パッケージ名)linux - Determining the path that a yum package installed to - Stack Overflowより転載
概要 最近word2vecという単語のベクトル表現を学習して単語の意味を足したり引いたりできるものが流行っていて面白そうだったので試しにMagic: The Gatheringについて学習させてみました.card2vecは勝手に作った造語です. 手順 自然言語処理をなにも知らない私がword2vecを走らせるまで: 最尤日記,自然言語処理の最新手法"word2vec"で艦これ加賀さんから乳を引いてみる - あんちべ!を参考にしました. 1. 必要なソフトウェアをインストールする word2vec MeCab(日本語を単語ごとに分かち書きするのに使います) 2. M:TGについて書かれた文章を用意する とりあえず以下の3つをwget -rとか使いながらダウンロードして,タグなどを消して必要そうなところ(MTG Wikiなら記事の本文,Astral Guildと2chは各書き込みの本文)だけ抽
java.io.InputStreamにはbyte配列を引数に取り,byte配列にデータを読み込んで格納するreadメソッドがありますが,一度の呼び出しでストリームの終わりまで全て読み込むことは保証されません.データを全て読み込んでbyte配列に格納して返すreadAllメソッドは次のように書けます. public byte[] readAll(InputStream inputStream) throws IOException { ByteArrayOutputStream bout = new ByteArrayOutputStream(); byte [] buffer = new byte[1024]; while(true) { int len = inputStream.read(buffer); if(len < 0) { break; } bout.write(buffe
このページを最初にブックマークしてみませんか?
『学生時代に頑張ったことが何もない』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く