wushiのブックマーク - はてなブックマーク

最適制御からの強化学習 - HELLO CYBERNETICS
はじめに最適制御そもそも制御問題とは？自動制御フィードバック制御制御問題の例最適制御問題最適制御のまとめ最適制御から強化学習へ最適制御の困難強化学習の形式と最適制御との比較環境の振る舞いを知る方法は無いのか強化学習の大まかな流れモンテカルロ法 TD法関数近似最後に制御の分野と強化学習基本的思想の違い実用的問題 PID制御という巨人はじめに強化学習といえば、最強の囲碁ソフトAlpha Go に搭載されているアルゴリズムで一躍有名となった分野です。今回は強化学習の特殊な問題設定がどういうものであるかを強調するため、最適制御としての立場から発展させた強化学習を見てみたいと思います。最適制御そもそも制御問題とは？例えば、自動車の速度を調整する場合、タイヤの回転を調整する必要がありますが、私達が実際にやっているのはアクセルやブレーキを踏み込むことだけです。
wushi 2017/10/30
あとで読む
リンク
機械学習・ディープラーニング・強化学習・ベイズを学べる無料講座 - HELLO CYBERNETICS
はじめにここでは、機械学習、ディープラーニング、強化学習、ベイズを無料で学ぶことのできるオンラインリソースを項目ごとにまとめておきます。機械学習 ITについて学べるオンライン講座「Udacity」は、基本的に有料で講座を受けるのですが、中には非常に中身の詰まったコンテンツで、かつ無料の講座も存在します。以下の講座では、機械学習の各技術に関して広くカバーしており、決定木からサポートベクターマシン、ニューラルネットワークやベイズ、強化学習まで学ぶことができます。かなりのボリュームなので興味のあるところを学んでいく感じでも良いと思います。 www.udacity.com s0sem0y.hatena blog.com s0sem0y.hatena blog.com ディープラーニング同じくUdacityからディープラーニングに関する講座です。多層パーセプトロンから畳み込みニューラルネット
wushi 2017/07/23
Machine Learning

ディープラーニング

AI
リンク
人工知能の歴史　AIを如何にして達成しようとしたか - HELLO CYBERNETICS
※めちゃくちゃ長いです。一連の流れで読むと理解が深まると思います。自身の復習のためにも書き下しました。個々の章で完結しているので、それぞれ別の記事としても掲載しています。近年は人工知能ブームが到来し、人工知能というワードを当たり前のように使う時代がやってきました。情報技術を学んでいる人にとって人工知能は、情報処理を効率的に行う素晴らしい技術の一つとして認識できるかと思います。一方で、技術的話題にあまり興味がない人にとっては、人工知能というワードに対して各々の解釈をして、時には誤解のような意見も見受けられます（人工知能の全容がハッキリしないうちは誤解というのはあまりにも強すぎる言い方ですが）。人工知能がどういうものであるのかを知るには、人工知能を技術的にいかにして達成しようとしたかの歴史を知ることが一番であると思います。ここでの記事の目的は技術的な観点からの人工知能について説明すること
wushi 2016/12/06
AI

science

機械学習
リンク
1