【論文】Spatial Transformer Networks (NIPS 2015) をできる限り省略せずに読んでいくNIPSDeepLearningCNNSpatialTransformerNetworks はじめに NIPS2015にて採択された "Spatial Transformer Networks" について読みましたので、まとめていこうと思います。 Google DeepMindに所属する方々による論文であり、大雑把な内容としては、画像の空間的補正(アフィン変換など)のパラメータを予測するネットワークを全体のネットワークに組み込むことで、BackPropにより画像補正のパラメータを適切に予測することができるという内容の論文です。 これにより、例えば入力画像に歪みが生じていたり、対象物の周囲の景色なども写っているようなデータに対して、うまく対象物のみを切り出し、対象物の姿勢