このVGGモデルは提案された2014年のILSVRCというImageNetを用いた画像認識の精度を競うコンペティションにおいて、なんと画像分類部門で2位、物体のローカライゼーション部門で1位を獲得!!このコンペティションで一躍有名になったVGGモデルは現在もtensorflowやPyTorchなどで実装とImageNetの学習済みモデルが用意されており、簡単に利用することができるようになっています。 VGGは16層のバージョンと19層のバージョンがあり、論文のタイトルからわかる通り当時のCNNとしては圧倒的に多くの層が重なっているモデルです。2012年のILSVRC優勝モデルのAlexNetは8層、2013年に提案されたZFNetが同様に8層であることから当時のVGGがいかに深い層を持つモデルであったかが理解できますよね。 またVGGは学習済みモデルが公開されたこともり、SSDなどの物体検