今まで一般物体認識や一般物体検出にはあんまり興味が無かったんだけど、YOLOとかSSD、Mask R-CNNといった手法をベースにして特定のタスクを解く研究も結構登場しているので、その体系を知りたくなってきた。 幸い、ディープラーニングによる一般物体検出の研究はもう5, 6年経っていてネット上に教材が豊富なので、色々と漁りながら勉強してみる。スクラップブックみたいな感じで色んな人による解説資料を引用して並べるとディティールを補完しやすい。 一般物体検出(Generic Object Detection) そもそも一般物体検出(Generic Object Detection)とは、画像に何が写っているかを識別する一般物体認識(Generic Object Recognition)に対して、さらに物体が画像のどの位置に写っているかも特定すること。 人の顔など、画像の中から特定の物体を検出して
![R-CNN (Regions with CNN features):ディープラーニングによる一般物体検出手法](https://cdn-ak-scissors.b.st-hatena.com/image/square/5d5f9ba8bd74985c0c3e4f353ef97b687740cb51/height=288;version=1;width=512/https%3A%2F%2Fblog.negativemind.com%2Fwp-content%2Fuploads%2F2019%2F02%2F1_REPHY47zAyzgbNKC6zlvBQ.jpg)