rishidaのブックマーク / 2013年11月22日

Engadget | Technology News & Reviews

Pick up the 9th-gen iPad with two years of AppleCare+ for only $298

rishida 2013/11/22

NTTドコモは、横須賀の研究開発拠点、ドコモR&Dセンターで技術関連の説明会を開催しました。写真は安全かつ導電性のあるウェアラブル電極素材の展示。 NTTグループは国内屈指の研究開発チームを持っています。電波や

リンク

なぜ無作為化なのか：『因果推論の根本問題』とその解法 - Take a Risk：林岳彦の研究メモ

こんにちは。林岳彦です。はてなジョシュ（バーネット）です。今回から「はてなブログ」へ引っ越しました。今後とも引きつづきよろしくお願いします。さて。前回までの記事では、実験データではない調査観察データを用いた因果効果の推定における注意すべきバイアスの類型について書いてきました。ここでなぜわざわざ「実験データではない」という但し書きをつけているのかというと、適切なデザインに基づき行われた実験（もしくは介入を伴う調査）からのデータは、処理・条件の違いによる結果の差を素直に「因果効果」とみなして解釈できるので、余り細かいことを考えなくても大丈夫だからです*1。はい。では、そもそも、なぜそのような実験では「結果の差を素直に因果効果とみなせる」のでしょうか？今回は、その背景となるロジックについて書いていきたいと思います。（すみません今回もものすごく長いです。。。）まずは「因果効果」を定

rishida 2013/11/22

2013-11-21 なぜ無作為化なのか：『因果推論の根本問題』とその解法こんにちは。林岳彦です。はてなジョシュ・バーネットです。今回から「はてなブログ」へ引っ越しました。今後とも引きつづきよろしくお願いします。

リンク

バンディットアルゴリズム入門と実践

東京大学松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です．強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています．巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました．主に以下のような強化学習の概念やアルゴリズムの紹介をしています．・マルコフ決定過程・ベルマン方程式・モデルフリー強化学習・モデルベース強化学習・TD学習・Q学習・SARSA ・適格度トレース・関数近似・方策勾配法・方策勾配定理・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN（Deep Q-Network）・経験再生・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois

rishida 2013/11/22

via はてなブックマーク - rishida のブックマーク - お気に入り http://b.hatena.ne.jp/rishida/favorite

リンク

はてなブックマーク

タグ

2013年11月22日のブックマーク (3件)

Engadget | Technology News & Reviews

なぜ無作為化なのか：『因果推論の根本問題』とその解法 - Take a Risk：林岳彦の研究メモ

バンディットアルゴリズム入門と実践

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス