タグ

ブックマーク / qiita.com/shinmura0 (2)

  • 【異常検知】食品画像を攻略してみる - Qiita

    今回は、実例があまり出てこない品画像を攻略してみたいと思います。(といっても、精度100%は出ていません(^^;) (右端「Padim + YOLOv5」が提案手法) 品画像の難しさ 品画像の検査は、工業製品と違って難しいと言われています。個人的には 見た目に多様性がある 位置が決まっていない が理由だと思っております。 見た目の多様性は、例えばミカンでいうと、色やサイズ、形が様々で、一つとして同じものはありません。つまり、正常品の範囲が広く、正常/異常の境界線があいまいになりがちです。一方、工業製品は多様性が少なく、正常品の範囲が狭いです。このため、正常/異常の境界線がはっきりしています。 二点目、「位置が決まっていない」は、品という特性上、位置が多少ズレることがあります。さらに、2つの品があったとして、2つの位置が入れ替わったとしても正常となることがあります。つまり、位置ベー

    【異常検知】食品画像を攻略してみる - Qiita
  • 【まとめ】ディープラーニングによる環境音の認識 - Qiita

    とあるきっかけで、環境音の認識(歩く音や雨の音、掃除機の音など)について、 論文を調べたので、メモとして残しておきます。 せっかくなので、精度向上の歴史を振り返る形式で、書いていきます。 データセット 精度の基準となるデータセットをご紹介します。画像の認識では、ImageNetという圧倒的な データセットがあり、性能評価で用いられます。 一方、音の認識はImageNetほど巨大ではありませんが、ESC-50というデータセットが あります。今回の基準となるESC-50の概要は以下のとおりです。 犬の鳴き声やドアのノック音など50種類、2000個の音源を収録 音源の長さは5秒間 精度評価をするときは、学習用とテスト用に分けて(5-foldなど)それぞれ評価 音の前処理 画像の前処理は、通常255で割れば良く、非常に簡単です。 一方、音の前処理は通常logmelを用います。logmelで処理する

    【まとめ】ディープラーニングによる環境音の認識 - Qiita
  • 1