Making our cities move more efficiently matters to us all. That's why we're providing access to anonymized data from over 2 billion trips to help improve urban planning around the world.
News 2022-06-01 We release the DeepFashion-MultiModal dataset with rich multi-modal annotations, including manually annotated human parsing labels, manually annotated human keypoints, manually annotated fine-grained labels and textual descriptions. 2020-05-04 Parsing mask annotations and dense pose annotations have been added to “In-shop Clothes Retrieval Benchmark”. Fine-grained attribute annotat
Note that this is a work in progress and the final, reference version is coming soon. Please ask Caffe and FCN usage questions on the caffe-users mailing list. Refer to these slides for a summary of the approach. These models are compatible with BVLC/caffe:master. Compatibility has held since master@8c66fa5 with the merge of PRs #3613 and #3570. The code and models here are available under the sam
今回は下記の記事で導入したCaffeを用いて、ImageNetを学習してみる。 【メモ書き】Ubuntu 14.04 CUDA6.5 GTX970 Caffeインストール - 下丸子のコネクショニスト ImageNet(イメージネット)は大規模画像認識のコンペティションを毎年開催している組織で、 Stanford大のFei-Feiなどが監修している。 コンペの正式名称をLarge scale visual recognition challengeというのだが、 ここでは単にImageNetと呼ぶことにする。 トロント大のHintonらとともにAlexが提案し、 今ではDeep Convolutional Neural Networkのベースモデルとして扱われている通称AlexNetは、 2012年のImageNetにて発表されたものだ。 AlexNetはCaffeのZoo(様々なニューラ
最近は画像認識・検索で用いられるデータセットも大規模化が進んでいます。 いくつか代表的なものや最近見つけたものをまとめてみます。 (ここでの目安は、教師つきデータは10万枚以上、教師なしデータは100万枚以上のもの) ImageNet http://www.image-net.org/ 自然言語処理の分野で有名なWordNetのオントロジーに従って、各単語(今のところ名詞のみ)に対応する画像を収集したものです。Amazon Mechanical Turk を利用し、質の高いデータセットを構築するように工夫されています。日々データは蓄積・更新されており、2012年1月現在、約1400万枚の画像データ(2万2千カテゴリ)が集まっているようです。 アノテーションは基本的に1画像1カテゴリで、一部の画像には物体の位置を示すbounding boxもついています。カテゴリによっては十分な数の画像がな
Posted by Sudheendra Vijayanarasimhan and Paul Natsev, Software Engineers Many recent breakthroughs in machine learning and machine perception have come from the availability of large labeled datasets, such as ImageNet, which has millions of images labeled with thousands of classes. Their availability has significantly accelerated research in image understanding, for example on detecting and class
Posted by Ivan Krasin and Tom Duerig, Software Engineers In the last few years, advances in machine learning have enabled Computer Vision to progress rapidly, allowing for systems that can automatically caption images to apps that can create natural language replies in response to shared photos. Much of this progress can be attributed to publicly available image datasets, such as ImageNet and COCO
Fine-tuning CaffeNet for Style Recognition on “Flickr Style” Data Fine-tuning takes an already learned model, adapts the architecture, and resumes training from the already learned model weights. Let’s fine-tune the BAIR-distributed CaffeNet model on a different dataset, Flickr Style, to predict image style instead of object category. Explanation The Flickr-sourced images of the Style dataset are
IMDB-WIKI – 500k+ face images with age and gender labels Rasmus Rothe, Radu Timofte, Luc Van Gool DEX: Deep EXpectation of apparent age from a single image Looking at People Workshop International Conference on Computer Vision (ICCV), 2015 ∗ Winner of LAP challenge on apparent age estimation ∗ NVIDIA ChaLearn LAP 2015 Best Paper Award In this paper we tackle the estimation of apparent age in still
What is COCO? COCO is a new image recognition, segmentation, and captioning dataset. COCO has several features: Object segmentation Recognition in Context Multiple objects per image More than 300,000 images More than 2 Million instances 80 object categories 5 captions per image Keypoints on 100,000 people Tsung-Yi Lin Cornell Tech Genevieve Patterson MSR Matteo Ruggero Ronchi Caltech Yin Cui Corne
MPII Human Pose Dataset, Version 1.0 Copyright 2015 Max Planck Institute for Informatics Licensed under the Simplified BSD License [see bsd.txt] We are making the annotations and the corresponding code freely available for research purposes. Commercial use is not allowed due to the fact that the authors do not have the copyright for the images themselves. You can download the images and annotation
Cross-Age Reference Coding for Age-Invariant Face Recognition and Retrieval Abstract Recently, promising results have been shown on face recognition researches. However, face recognition and retrieval across age is still challenging. Unlike prior methods using complex models with strong parametric assumptions to model the aging process, we use a data-driven method to address this problem. We propo
本特集では、Treasure Data環境で利用可能な機械学習ライブラリHivemallを利用した機械学習の実践方法を紹介します。世界のデータサイエンティストが腕を競うデータサイエンスコンペティションサイトKaggleの中から、実践的な課題を扱っていきます。 1. はじめに 第一回は小売業の売り上げ予測するタスクであるRossmann Store Salesコンペティションを課題に用います。アルゴリズムとしては、決定木を利用したアンサンブル学習手法の一種であるRandom Forest回帰を利用します*1。 Rossmannはヨーロッパの7カ国で3,000以上の店舗を展開する薬局チェーンです。各店舗のマネージャーは6週間先までの店舗の売り上げを予測することがタスクとして課されています。各店舗の売り上げはプロモーション活動、競合要素、学校の休みや祝日、季節性、地域性など様々な要因に左右されま
Multivariate, Sequential, Time-Series, Domain-Theory
The Yahoo Webscope Program is a reference library of interesting and scientifically useful datasets for non-commercial use by academics and other scientists. All datasets have been reviewed to conform to Yahoo's data protection standards, including strict controls on privacy. We have a number of datasets that we are excited to share with you. Yahoo is pleased to make these datasets available to re
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く