doraneko_tomのブックマーク - はてなブックマーク

C89 3日目に行ってきた - kivantium活動日記
C89 3日目に面白そうな同人誌がたくさん売っていたので参戦していろいろ買ってきました。買ったもの・中身の紹介・感想を書いていきます。戦利品 pic.twitter.com/ZM12L4FVmE— 川奈清 (@kivantium) 2015, 12月 31 SIG2D'15 今回のメインターゲットはこれでした。新刊の'15と既刊の'14を買いました。（サークルのWebサイト）ご注文はDeep Learningですか？ - kivantium活動日記はSIG2D'14の「葉月ちゃんでも出来るDeep Learning」のコードを使って書いたものです。「ソースコード上げていいのだろうか」とTwitterに書いたら中の人がMITライセンスであることを追記してくれたのでとても助かりました。友利奈緒判定botとかもこれの派生なのでSIG2Dにはとても感謝しています。本当にありがとうございます
doraneko_tom 2016/01/02
リンク
強化学習で考えるギャンブラーの最適行動 - kivantium活動日記
強化学習と呼ばれる機械学習の一分野があります。機械学習というと、入力に対して正解の出力を当てる教師あり学習が話題になることが多いですが、強化学習では明示的に正解が与えられません。ある行動を試してみて、それに対して得られる「報酬」から自分でどのような行動が良い結果をもたらすのかを判断して、より良い行動を学習するアルゴリズムになっています。強化学習にはチェスやリバーシなどといったボードゲームのAIやロボットの行動学習などの応用例があります。この前話題になったDeep Q Network、通称DQNも強化学習の一種です。応用例が面白いにも関わらず、PRMLなどの主要な機械学習の教科書では強化学習を扱わないことが多いので、いま強化学習だけの参考書を買って勉強しています。強化学習作者: Richard S.Sutton,Andrew G.Barto,三上貞芳,皆川雅章出版社/メーカー: 森北出
doraneko_tom 2015/09/29
リンク
1

はてなブックマーク

タグ

ブックマーク / kivantium.hateblo.jp (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第2週）

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / kivantium.hateblo.jp (2)

C89 3日目に行ってきた - kivantium活動日記

強化学習で考えるギャンブラーの最適行動 - kivantium活動日記

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第2週）

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス