You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
AlphaGo以降、加速するDQN研究だが… Learning reinforcement learning Why study Reinforcement learning HOW TO STUDY REINFORCEMENT LEARNING 追記【2017/1/7】 まとめ 関連記事 AlphaGo以降、加速するDQN研究だが… 囲碁で世界チャンピオンを破ってしまったのは衝撃でしたね。これ以降、更に研究が世界中で加速しています。 しかしAlphaGoに関しても、メディアではキャッチーな結果を伝えて*1、あまり技術的な中身に触れることはないので、魔法の箱と化しています。 そのため、強化学習、面白そうだけど囲碁の他にいまいち何ができるのかわからない。という人も多いと思います。 昨日、強化学習についての良い記事を見つけたので、一部抜粋して和訳をしながら紹介したいと思います。 Learnin
概要 この記事では、Neural NetworkフレームワークであるChainerの最も特徴的なコンセプトである"Define-by-Run"を理解するために、手書き数字の分類を行うためのネットワークの記述・学習に必要な最低限の機能だけを持ったライブラリ"1f-chainer"をNumPyのみを使って実装してみます。数式が登場するような説明は全てAppendixに追いやり、本文中ではできるだけコードと文章だけで説明を行うように気をつけて書きました。 本記事で用いた全てのコードは以下に置いてあります:1f-chainer。書き始めると色々なことを追記したくなり間に合わなかったので、今週いっぱいを目処に順次更新していきます。 また、この記事の全ての内容は私個人の見解と理解に基づくものであり、所属する組織とは関係ありません。 想定読者 この記事は、Backpropagationを使ったNeura
警告 この記事はすでにサポートが打ち切られているChainer v1の最終リリース(v1.24.0)向けに書かれた笑えないレベルで古すぎる記事です。 2017年12月時点での最新安定版のChainer v3向けに書かれた記事がこちらにありますので、どうしてもv1に入門する必要があるという超特殊事情を抱えた方以外は、今すぐそちらに飛んでください。 Go!! -> Chainer v3 ビギナー向けチュートリアル 第1回 Chainer Beginner's Hands-onを大手町にあるPreferred Networksオフィスの多目的室にて開催いたしました。この記事は、このハンズオンで行った内容を記事化したものです。 ハンズオン当日に使用した資料等は以下のGithubリポジトリにまとめられています。 mitmul/chainer-handson 当日は、さくらインターネット様より4つのP
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く