今更ですがFaster R-CNNとRPNについて勉強していたら、思いのほか分かりやすい記事がなかったので自分で書くことにしました。 英語版はこちら Faster R-CNNとは2015年にMicrosoftが発明した物体検出アルゴリズムです。Deep LearningによるEnd-to-Endな実装に初めて成功しています。 元論文:https://arxiv.org/pdf/1506.01497.pdf ざっくりとした流れは ① ある矩形の中身が物体なのか背景(=何も写っていない)なのかを学習 ② ①で検出した場所に、具体的に何が写っているのかを学習 という2段構造です。Faster R-CNNの偉い所は①においてResion Proposal Network(RPN)と呼ばれるCNN構造を用いたところです。今までは画像処理の手法であるSelective Searchを使っていたのですが