インターンで画像の分類をしているのですが、最近はFCNのようなセグメンテーションをタスクに使っているので代表的な手法をいくつかまとめようと思います。 Fully Convolutional Networks for Semantic Segmentation AlexNetやVGGの全結合層をConvolution層に置き換えることで画像をピクセル単位で推定する(Semantic Segmentationする)手法を提案しました。非常に読み応えのある論文で、今までに10回くらい読んでいますが新しい発見が毎回あります。 ポイントはいくつがあるので、一つ一つまとめていきます この論文の手法の最も重要な提案手法は、CNNの最後の全結合層をConvolutionに置き換えるということです。例えば、AlexNetのConv5の次の全結合層は6x6のConvolution層と見なすことができます。この
![ディープラーニング セグメンテーション手法のまとめ - The End of the World](https://cdn-ak-scissors.b.st-hatena.com/image/square/fdcd4ad152dbf73c0a8e30bc5d1e5f9f511bf650/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fd%2Fdl-kento%2F20170430%2F20170430215326.png)