タグ

ブックマーク / medium.com/@arxivtimes (2)

  • PyTorchで始めるYOLOと、文書分類におけるCNNのフィルタの初期化

    が発表しました。Better, Faster, Strongerと銘打っている通り、その工夫は3つに分かれています。 Better ・すべての畳込み層にBatch Normalization ・認識する領域(バウンディング)を設定する際、IoU=回答範囲との一致率で様々なバウンディングをクラスタリングし、確度が高いものから見て行く(経験的に検出可能性が高い領域から見ていく)。 Faster ・Darknetを使用+事前学習済みモデルを利用 ・パラメーター量を増やす原因となる全結合層を廃止 Stronger ・9000クラスのsoftmaxは大変なので、クラスに階層構造を持たせてツリーのノード単位での予測を行っている。具体的には、MS COCOのクラスをWordNetに当てはめて、子のノードにImageNetのクラスを対応させ、COCOのクラス=>ImageNetのクラス、と段階的な分類を行

    PyTorchで始めるYOLOと、文書分類におけるCNNのフィルタの初期化
    ohnabe
    ohnabe 2017/12/25
  • ラベルなしデータの有効活用:深度の推定と画像の分類

    8/9のarXivTimes輪講では、ラベルなしのデータを有効に活用した研究が紹介されました。今あるデータをどう活用するか、という点は実運用においても役立つテーマと思います。 Unsupervised monocular depth estimation with Left-Right Consistency こちらは一枚の写真から深度を推定する手法を、画像/深度(Depth map)のペアではなくステレオ画像から学習させようという試みです。深度の教師データを作成するのは面倒ですが、ステレオ画像なら簡単に集められます。これを有効に活用することを試みた研究です。 手法としては、Depth mapを直接推定するのではなくステレオ画像における視差(Disparity map)の推定を行っています(視差がわかれば深度も推定できるため)。左カメラ画像から視差を推定し、推定視差と元の画像を組み合わせた

  • 1