論文紹介 1 Spatial As Deep: Spatial CNN for Traffic Scene Understanding (AAAI2018)[4] この論文はspatial cnnという独自で提案したレイアを既存のsemantic segmentationのネットワークに差し込むことで、モデルの精度を高める、ということを主張しています。 学習のフェーズは下記の図の(a)に示されています。 まずは画像をbackboneに通してfeature mapを生成します。次に、ネットワークが二つのブランチに分かれて、右の方はこの画像に区画線何本あるのか、をそれぞれ予測します。1はある、0はなし、という風になっています。ここに四つの数字が出てくるのは最大4本の区画線しか検出出来ないということです。左のブランチは区画線のfeatue mapで、サイズがW*H*5です。5チャンネルの内訳は4