が発表しました。Better, Faster, Strongerと銘打っている通り、その工夫は3つに分かれています。 Better ・すべての畳込み層にBatch Normalization ・認識する領域(バウンディング)を設定する際、IoU=回答範囲との一致率で様々なバウンディングをクラスタリングし、確度が高いものから見て行く(経験的に検出可能性が高い領域から見ていく)。 Faster ・Darknetを使用+事前学習済みモデルを利用 ・パラメーター量を増やす原因となる全結合層を廃止 Stronger ・9000クラスのsoftmaxは大変なので、クラスに階層構造を持たせてツリーのノード単位での予測を行っている。具体的には、MS COCOのクラスをWordNetに当てはめて、子のノードにImageNetのクラスを対応させ、COCOのクラス=>ImageNetのクラス、と段階的な分類を行
![PyTorchで始めるYOLOと、文書分類におけるCNNのフィルタの初期化](https://cdn-ak-scissors.b.st-hatena.com/image/square/d77b77b035eeafee34e2abf7b6b5c42b8120c851/height=288;version=1;width=512/https%3A%2F%2Fmiro.medium.com%2Fv2%2Fresize%3Afit%3A894%2F1%2AloAKANbT9X-Q8j0TzhuMug.png)