The requested URL was not found on this server. If you entered the URL manually please check your spelling and try again.
Computer vision, image processing, research resources
The underground station where images are captured Sample images in the dataset Download Download Including raw images, features, and train/test partitions. Details The QMUL underGround Re-IDentification (GRID) dataset contains 250 pedestrian image pairs. Each pair contains two images of the same individual seen from different camera views. All images are captured from 8 disjoint camera views inst
Welcome Hi, there! We received quite a few requests for access to the product image dataset used in our paper on "Connecting Missing Links: Object Discovery from Sparse Observations Using 5 Million Product Images", published in the proceedings of ECCV 2012. We are excited to see what cool applications this dataset could facilitate out there. So we are in the process of collecting necessary permis
We take advantage of our autonomous driving platform Annieway to develop novel challenging real-world computer vision benchmarks. Our tasks of interest are: stereo, optical flow, visual odometry, 3D object detection and 3D tracking. For this purpose, we equipped a standard station wagon with two high-resolution color and grayscale video cameras. Accurate ground truth is provided by a Velodyne lase
最近は画像認識・検索で用いられるデータセットも大規模化が進んでいます。 いくつか代表的なものや最近見つけたものをまとめてみます。 (ここでの目安は、教師つきデータは10万枚以上、教師なしデータは100万枚以上のもの) ImageNet http://www.image-net.org/ 自然言語処理の分野で有名なWordNetのオントロジーに従って、各単語(今のところ名詞のみ)に対応する画像を収集したものです。Amazon Mechanical Turk を利用し、質の高いデータセットを構築するように工夫されています。日々データは蓄積・更新されており、2012年1月現在、約1400万枚の画像データ(2万2千カテゴリ)が集まっているようです。 アノテーションは基本的に1画像1カテゴリで、一部の画像には物体の位置を示すbounding boxもついています。カテゴリによっては十分な数の画像がな
今日は、画像のシーン認識の歴史について、データセットを中心にまとめてみたいと思います。 シーン認識というと人によっていろいろ違うものを想像する気がしますが、ここで扱うのは単純な画像全体のカテゴライゼーションの問題です。 Caltech101みたいな物体認識とは何がちがうんだ?と思われるかもしれませんが、実際のところ明確な区別はありません。少なくとも現在では、技術的にもほぼ同じ枠組みで扱われることがほとんどです。私が思う違いを強いて挙げるなら、物体認識は画像中の特定領域に対象を関連付けることができる(すなわち、検出ができる)のに対し、シーン認識はあくまで画像全体との対応である場合が多いことでしょうか。 以下、代表的なデータセットを古い順にいくつか紹介します。 データセットの名前は、開発者の頭文字+クラス数で呼称されているものが多いので、ここでもそれにならいます。(最近はそうでもないですが)
ImageNet is an image database organized according to the WordNet hierarchy (currently only the nouns), in which each node of the hierarchy is depicted by hundreds and thousands of images. The project has been instrumental in advancing computer vision and deep learning research. The data is available for free to researchers for non-commercial use.
If you have additions or changes, send an e-mail (remove the "nospam"). This material is presented to ensure timely dissemination of scholarly and technical work. Copyright and all rights therein are retained by authors or by other copyright holders. All persons copying this information are expected to adhere to the terms and constraints invoked by each authors copyright. Participate in Reproducib
On October 29th at ICCV 2019 in Seoul, the creators of LFW were honored with the Mark Everingham Award for service to the Computer Vision Community. Thanks to all that have participated in making LFW a success! New results page: We have recently updated and changed the format and content of our results page. Please refer to the new technical report for details of the changes. Labeled Faces in the
Acknowledgements Many thanks to Engin Tola for the web interface and to all who provided their results on these datasets. The original results are published in: C. Strecha, W. von Hansen, L. Van Gool, P. Fua, U. Thoennessen On Benchmarking Camera Calibration and Multi-View Stereo for High Resolution Imagery CVPR 2008 [pdf] When using the datasets in any publication, please refer to them with the e
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く