Update 06/18/2018: please also check our follow-up blog post after reading this. TL;DR, we released the largest and most diverse driving video dataset with rich annotations called BDD100K. You can access the data for research now at http://bdd-data.berkeley.edu. We have recently released an arXiv report on it. And there is still time to participate in our CVPR 2018 challenges! Large-scale, Diverse
Faster R-CNNのCaffe・Python実装「py-faster-rcnn」において、COCOデータセットを用いてトレーニングしたモデルで物体検出を試してみました。 以下の記事のpy-faster-rcnnですが、README.md通りに実行した場合、PASCAL VOC2007データセットを用いてトレーニングしたモデルがダウンロードされます。 PASCAL VOC2007では、以下の20種類のカテゴリーが設定されてます。 ‘aeroplane’, ‘bicycle’, ‘bird’, ‘boat’, ‘bottle’, ‘bus’, ‘car’, ‘cat’, ‘chair’, ‘cow’, ‘diningtable’, ‘dog’, ‘horse’, ‘motorbike’, ‘person’, ‘pottedplant’, ‘sheep’, ‘sofa’, ‘train’,
Posted by Vittorio Ferrari, Research Scientist, Machine Perception Last year we introduced Open Images, a collaborative release of ~9 million images annotated with labels spanning over 6000 object categories, designed to be a useful dataset for machine learning research. The initial release featured image-level labels automatically produced by a computer vision model similar to Google Cloud Vision
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く