The Tradeoffs of Large Scale Learning (L. Bottou and O. Bousquet, NIPS 2008) は、大規模データから機械学習を行う際のエラーについての考察を行った論文である。 機械学習を行う場合、なんらかの損失を定義し、その損失を最小化するようにパラメータを調整する事が多い。また、最終的にその損失を0にする事は概ね不可能である。エラーが発生する理由を、さらに3つに分解する事ができる。 真の確率分布を近似する際に発生するエラー(例えば、混合正規分布を単なる正規分布で近似したりすると、表現力が不足する) 期待損失と経験損失で、最小化している物が違うために発生するエラー 最適なパラメータと、現実的な時間で求める事ができるパラメータの差分として発生するエラー 一つ目のエラーを減らすためには、できるだけ表現力の大きなモデルを選ぶべきであるが、