タグ

2016年4月24日のブックマーク (3件)

  • 倒立振子で学ぶ DQN (Deep Q Network) - Qiita

    強化学習の一手法であるQ-learning とディープニューラルネットを組み合わせた Deep Q Network、通称DQNを使って倒立振子の振り上げ問題を解決してみます。 問題設定 「倒立振子の振り上げ問題」というのは、今回はこういう問題設定です。 まず空中に静止したモータがあって、モータ軸に棒の一端がつながっています。棒は中心に質量が集中していて剛性$\infty$で太さ0の、よくある棒です。初期状態では棒は重力にしたがって下向きにぶら下がっています。この状態から振り子を振り上げて倒立状態で静止させてください、という問題です。古きよき制御工学では、振り上げ用と静止用に別設計されたコントローラを2つ用意して切り替えるなど、非線形要素を含むコントローラを用いて対処することになります。いや、やったことないですけど、そうらしいです。 今回は、モータは右か左に一定トルクの回転しかできない、とし

    倒立振子で学ぶ DQN (Deep Q Network) - Qiita
    jusuke
    jusuke 2016/04/24
  • DeepLearningだ!と意気込んだものの手書き数字認識の後に続かなくなった時に読むデータそのものの話 - Qiita

    DeepLearningだ!人工知能だ!機械学習だ! エンジニアとしての意気込みと、 なんだかすごいことが出来そうだな!という上司の後押しを一身に受け、 深層学習やQiita記事を流し読み、 TensorFlowやChainerを導入して、 チュートリアルの写経で徳を積んで、 ゲームに使っていたGPUも学習という大義名分のもとフル稼働させた、、、 Accuracy 99.23% 今回は、MNISTやIRISを99%超で識別するエンジンを実装して満足してしまったエンジニアが MNISTを脱却するためにMNISTを知るための話 おなじみ、「MNIST」がつまりどんなデータなのか? 28行28列の画像→正しいが今はそこではない。 データセットとしては、70000行784列、 70000はサンプル数、784は28*28をベクトルに直した時の次元数。 行に解析したいデータ総数、列に解析したいデータ

    DeepLearningだ!と意気込んだものの手書き数字認識の後に続かなくなった時に読むデータそのものの話 - Qiita
    jusuke
    jusuke 2016/04/24
    “MNIST”
  • 【ディープラーニング】Chainerのインストールとchainer-goghのテスト

    こんにちは、海行です。 私はtwitterで前々から今アツい3つの領域は 1.VR(とAR) 2.人工知能 3.仮想通貨(ブロックチェーン) と言っていたんですが、人工知能については今まで全然着手してませんでした。 一応GoogleのCloud Vision APIを使ってDoge Cameraは作りましたが、今回はもう少し踏み込んで、国産のディープラーニング用フレームワークのChainerのインストールと、Chainer用プログラムのchainer-goghの実行テストまで行った結果の覚書を書きます。 ディープラーニングで実現したい目標 最初に私が人工知能(ディープラーニング)で実現したい目標をハッキリさせておきたいと思います。 それはズバリ、人工知能漫画を描いてもらう事です! 漫画を描いた事がある人ならわかるかもしれませんが、漫画を描くのは物凄く時間がかかります。 しかも作画中は手は

    【ディープラーニング】Chainerのインストールとchainer-goghのテスト
    jusuke
    jusuke 2016/04/24