タグ

Machine learningに関するslywalkerのブックマーク (3)

  • 分散深層強化学習でロボット制御 - Preferred Networks Research & Development

    新入社員の松元です。はじめまして。 “分散深層強化学習”の技術デモを作成し、公開いたしました。ロボットカーが0から動作を学習していきます! まずはこの動画を御覧ください。 以下で、動画の見どころと、使っている技術を紹介します。 動画の見どころ Car 0(○の付いている車)が右折カーブの手前で減速する様子(右画面の白いバーのところが、ブレーキのところで赤くなっている。ニューラルネットはブレーキが最も多く報酬が得られると推測していることがわかる)。速い速度ほど報酬は大きいが、カーブを曲がりきれず壁にぶつかってしまうので学習が進むとカーブ手前でのみ減速するようになる。 目の前に車がいるときは一時停止して、いなくなってから加速する。 エチオピアには当にこのような交差点があるらしい。 ぎりぎりですれ違う2台。学習途中ではすれ違いきれずにぶつかって倒れてしまうこともある(早送りシーン中に人が写って

    分散深層強化学習でロボット制御 - Preferred Networks Research & Development
    slywalker
    slywalker 2015/06/11
    やってみたい
  • ゼロから始めるDeepLearning_その1_ニューラルネットとは - 分からんこと多すぎ

    対象とする人 ディープラーニングすごい! ←聞き飽きた チュートリアルあるよ! ←ふわっとしすぎて具体的なところが分からん こういう論文あるよ! ←読めるわけないだろ そういう人向け。(たぶん学部四年程度向け) ニューラルネット初学者が、書ききるまで怪しいところ満載でも突っ走ります。 ニューラルネット(この記事) →(AutoEncoder) →(DenoisingAutoEncoder) →ホップフィールドネットワーク →ボルツマンマシン →Restrictedボルツマンマシン →(Gaussian Binary - Restricted Boltzmann Machines) →(DeepBeliefNetwork) →(DeepNeuralNetworks) →畳み込みニューラルネット(後日) までやる。 太線以外は読み飛ばしてOK 文中では怖い式は使わない。(Appendixに書

  • Statistical Semantic入門 ~分布仮説からword2vecまで~

    1. The document discusses various statistical and neural network-based models for representing words and modeling semantics, including LSI, PLSI, LDA, word2vec, and neural network language models. 2. These models represent words based on their distributional properties and contexts using techniques like matrix factorization, probabilistic modeling, and neural networks to learn vector representatio

    Statistical Semantic入門 ~分布仮説からword2vecまで~
  • 1