ni66lingのブックマーク / 2014年8月31日

ni66ling id:ni66ling

2014年8月31日のブックマーク (3件)

ノーフリーランチ定理 - Wikipedia
ノーフリーランチ定理（ノーフリーランチていり、no-free-lunch theorem、NFL）は、物理学者 David H. Wolpert と William G. Macready が生み出した組合せ最適化の領域の定理である。その定義は以下のようになる。 ……コスト関数の極値を探索するあらゆるアルゴリズムは、全ての可能なコスト関数に適用した結果を平均すると同じ性能となる — Wolpert and Macready、1995年解説[編集] この定理の名称は、ハインラインのSF 小説『月は無慈悲な夜の女王』（1966年）で有名になった格言の"There ain't no such thing as a free lunch."に由来する。かつて酒場で「飲みに来た客には昼食を無料で振る舞う」という宣伝が行われたが、「無料の昼食」の代金は酒代に含まれていて実際には「無料の昼食」なんてもの
ni66ling 2014/08/31
wikipedia

algorithm

数学
リンク
速水桃子「パターン認識と機械学習入門」
東京大学松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です．強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています．巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました．主に以下のような強化学習の概念やアルゴリズムの紹介をしています．・マルコフ決定過程・ベルマン方程式・モデルフリー強化学習・モデルベース強化学習・TD学習・Q学習・SARSA ・適格度トレース・関数近似・方策勾配法・方策勾配定理・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN（Deep Q-Network）・経験再生・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois
ni66ling 2014/08/31
PRML

slideshare
リンク
Vimから見たemacs
Unityネットワーク通信の基盤である「RPC」について、意外と知られていないボトルネックと、その対策法モノビットエンジン
ni66ling 2014/08/31
vim

emacs

slideshare
リンク
- 2014年9月1日
- 2014年8月31日
- 2014年8月28日