タグ

2017年4月30日のブックマーク (4件)

  • pfnet-research

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    pfnet-research
  • 【強化学習を使いたいすべての人へ】DQNの実践&理論の勉強もできる記事の紹介(2017/1/7追記) - プロクラシスト

    AlphaGo以降、加速するDQN研究だが… Learning reinforcement learning Why study Reinforcement learning HOW TO STUDY REINFORCEMENT LEARNING 追記【2017/1/7】 まとめ 関連記事 AlphaGo以降、加速するDQN研究だが… 囲碁で世界チャンピオンを破ってしまったのは衝撃でしたね。これ以降、更に研究が世界中で加速しています。 しかしAlphaGoに関しても、メディアではキャッチーな結果を伝えて*1、あまり技術的な中身に触れることはないので、魔法の箱と化しています。 そのため、強化学習、面白そうだけど囲碁の他にいまいち何ができるのかわからない。という人も多いと思います。 昨日、強化学習についての良い記事を見つけたので、一部抜粋して和訳をしながら紹介したいと思います。 Learnin

    【強化学習を使いたいすべての人へ】DQNの実践&理論の勉強もできる記事の紹介(2017/1/7追記) - プロクラシスト
  • [WIP] 1-file Chainerを作る - Qiita

    概要 この記事では、Neural NetworkフレームワークであるChainerの最も特徴的なコンセプトである"Define-by-Run"を理解するために、手書き数字の分類を行うためのネットワークの記述・学習に必要な最低限の機能だけを持ったライブラリ"1f-chainer"をNumPyのみを使って実装してみます。数式が登場するような説明は全てAppendixに追いやり、文中ではできるだけコードと文章だけで説明を行うように気をつけて書きました。 記事で用いた全てのコードは以下に置いてあります:1f-chainer。書き始めると色々なことを追記したくなり間に合わなかったので、今週いっぱいを目処に順次更新していきます。 また、この記事の全ての内容は私個人の見解と理解に基づくものであり、所属する組織とは関係ありません。 想定読者 この記事は、Backpropagationを使ったNeura

    [WIP] 1-file Chainerを作る - Qiita
  • [Deprecated] Chainer v1.24.0 ビギナー向けチュートリアル - Qiita

    警告 この記事はすでにサポートが打ち切られているChainer v1の最終リリース(v1.24.0)向けに書かれた笑えないレベルで古すぎる記事です。 2017年12月時点での最新安定版のChainer v3向けに書かれた記事がこちらにありますので、どうしてもv1に入門する必要があるという超特殊事情を抱えた方以外は、今すぐそちらに飛んでください。 Go!! -> Chainer v3 ビギナー向けチュートリアル 第1回 Chainer Beginner's Hands-onを大手町にあるPreferred Networksオフィスの多目的室にて開催いたしました。この記事は、このハンズオンで行った内容を記事化したものです。 ハンズオン当日に使用した資料等は以下のGithubリポジトリにまとめられています。 mitmul/chainer-handson 当日は、さくらインターネット様より4つのP

    [Deprecated] Chainer v1.24.0 ビギナー向けチュートリアル - Qiita
    aidiary
    aidiary 2017/04/30
    Notebookの内容が簡潔にまとまっていて参照に便利!