さて、昨年行ったGTC Japan 2017では物体検出のデモを行っているブースが多く、盛り上がりを見せている分野と感じています。 たしかに、物体検出のデモってすごくAI感(?)があります。 今回の記事はリアルタイム(~0.1sec)物体検出に使われるSSD及びその派生モデルのお話。 [1]SSD検出結果 物体検出の難しさ SSD ネットワーク構造 マルチボックスマッチング default boxと回帰によるオフセット予測 ハードネガティブマイニング ロス関数 データオーグメンテーション DSSD(Deconvolutional Single Shot Detector)の登場 Deconvolutional Module ResNetを使う。 Prediction Moduleの変更 Default Box増やした ESSD ESSDではやっぱりVGGを使う。 隣接したFeatureMa