タグ

ブックマーク / qiita.com/Hironsan (3)

  • Pythonではじめる強化学習 - Qiita

    はじめに みなさん、強化学習してますか? 強化学習はロボットや、囲碁や将棋のようなゲーム、対話システム等に応用できる楽しい技術です。 強化学習とは、試行錯誤を通じて環境に適応する学習制御の枠組みです。教師あり学習では入力に対する正しい出力を与えて学習させました。強化学習では、入力に対する正しい出力を与える代わりに、一連の行動に対する良し悪しを評価する「報酬」というスカラーの評価値が与え、これを手がかりに学習を行います。以下に強化学習の枠組みを示します。 エージェントは時刻 $t$ において環境の状態 $s_t$ を観測 観測した状態から行動 $a_t$ を決定 エージェントは行動を実行 環境は新しい状態 $s_{t+1}$ に遷移 遷移に応じた報酬 $r_{t+1}$ を獲得 学習する ステップ1から繰り返す 強化学習の目的は、エージェントが取得する利得(累積報酬)を最大化するような、状態

    Pythonではじめる強化学習 - Qiita
  • 絵で理解するWord2vecの仕組み - Qiita

    皆さん、Word2vec の仕組みはご存知ですか? Word2vec は gensim や TensorFlow で簡単に試せるので使ったことのある方は多いと思います。しかし、仕組みまで理解している方はそう多くないのではないでしょうか。そもそも家の論文でも内部の詳細については詳しく解説しておらず、解説論文が書かれているくらいです。 記事では Word2vec のモデルの一つである Skip-Gram について絵を用いて説明し、概要を理解することを目指します。まずは Skip-Gram がどのようなモデルなのかについて説明します。 ※ 対象読者はニューラルネットワークの基礎を理解しているものとします。 どのようなモデルなのか? Skip-Gram はニューラルネットワークのモデルの一つです。Skip-Gram は2層のニューラルネットワークであり隠れ層は一つだけです。隣接する層のユニット

    絵で理解するWord2vecの仕組み - Qiita
  • 新米エンジニア4人が機械学習の勉強会を行った話&記事まとめ - Qiita

    はじめに IT企業の新米エンジニア4名が集まって、CourseraのMachine Learningを教材にして機械学習の勉強会を行いました。その内容をまとめておきます。 背景 私たちの所属する部署は『中長期のビジネスに役立つ技術の検証』をミッションとして掲げており、その一環としてロボット技術の検証や機械学習、自然言語処理といったAIの要素技術に関する研究開発を行っています。そのような部署のため、新米エンジニアも当然機械学習の知識が求められます。しかし、私たちのバックグラウンドは様々で、機械学習の知識も不足していました。そのため、機械学習の基礎的な知識を身につけるために勉強会を行いました。 勉強会の目的 この勉強会の目的は以下のようなものです: 機械学習の基礎体力を身に付ける 勉強会の教材 勉強会の教材としてはCourseraのMachine Learningを採用しました。これはCour

    新米エンジニア4人が機械学習の勉強会を行った話&記事まとめ - Qiita
    tsu-nera
    tsu-nera 2016/02/04
  • 1