
コンピュータビジョンに関するaidiaryのブックマーク (135)

  • Earth Mover's Distance を用いた類似 Web 動画検索

    1 はじめに 近年,Web上ではかつてないほど膨大な量の動画を閲覧できる状況になっている. しかしながら,それらの検索システムについてはテキストベーストなものが利用されているのが現状である. この場合,ユーザによって付加されたタグと呼ばれるキーワードを基に検索を行なうのが一般的であるが, 付加するタグの選択はユーザの主観に依存するところが多く, 検索結果には様々な動画が存在してしまっている. これらタグだけでは判別できない内容の差異を認識するためには, 動画自身の特徴量を考慮することが重要であり, これらの研究は TRECVID [1]を中心に盛んに進められている. 研究では,これらの特徴量の比較基準に Earth Mover's Distance を利用し, キーフレーム数の異なる動画間での類似度算出を可能とすることで, キーフレームごとの特徴量を基にした類似動画検索を試みる. また,

  • TinEye Reverse Image

    TinEye is an image search and recognition company. We are experts in computer vision, pattern recognition, neural networks, and machine learning.

  • CIRES: Content based Image REtrieval System

    CIRES: Content Based Image REtrieval System CIRES is a robust content-based image retrieval system based upon a combination of higher-level and lower-level vision principles. Higher-level analysis uses perceptual organization, inference and grouping principles to extract semantic information describing the structural content of an image. Lower-level analysis employs a channel energy model to descr

  • The PASCAL Object Recognition Database Collection

    News 04-Apr-07: The VOC2007 challenge development kit is now available. Objectives To compile a standardised collection of object recognition databases To provide standardised ground truth object annotations across all databases To provide a common set of tools for accessing and managing the database annotations Standardising Each Database All images available in PNG format Annotated wi

  • SIFT Tutorial

    藤吉弘亘. "Gradientベースの特徴抽出 - SIFTとHOG - ", 情報処理学会 研究報告 CVIM 160, pp. 211-224, 2007. Scale-Invariant Feature Transform(SIFT) は,特徴点の検出と特徴量の記述を行うアルゴリズムである. 検出した特徴点に対して,画像の回転・スケール変化・照明変化等に頑健な特徴量を記述するため,イメージモザイク等の画像のマチングや物体認識・検出に用いられている. 稿では,SIFT のアルゴリズムについて概説し,具体例としてSIFT を用いたアプリケーションや応用手法への展開について紹介する.また,SIFT と同様にgradient ベースの特徴抽出法であるHistograms of Oriented Gradients(HOG)のアルゴリズムとその応用例として人検出についても紹介する. Scal

  • SSII08-Organized session -Object Recognition-


  • LabelMe. The Open annotation tool

    Welcome to LabelMe, the open annotation tool. The goal of LabelMe is to provide an online annotation tool to build image databases for computer vision research. You can contribute to the database by visiting the annotation tool.

  • Recognizing and Learning Object Categories

    Recognizing and Learning Object Categories Awarded the Best Short Course Prize at ICCV 2005 Li Fei-Fei (Stanford), Rob Fergus (NYU), Antonio Torralba (MIT) This course reviews current methods for object category recognition, dividing them into four main areas: bag of words models; parts and structure models; discriminative methods and combined recognition and segmentation. The emphasis will be on

  • Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure

    画像内に映り込んだ所望のオブジェクトを排除し、違和感の無い画像を生成するシーン補完技術に関しては近年複数の研究成果が発表されている。しかし中でも2007年のSIGGRAPHにて米カーネギメロン大のJames HaysとAlexei A. Efrosが発表した手法*1はブレークスルーとなりうる画期的なものだ。 論より証拠、早速適用例を見てみよう。エントリで利用する画像はPresentationからの引用である。元画像の中から邪魔なオブジェクト等の隠蔽すべき領域を指定すると、その領域が補完された画像が自動的に生成される。 アルゴリズム 効果は抜群だがアイデア自体は単純なものだ。Web上には莫大な数量の画像がアップされており、今や対象となる画像の類似画像を一瞬にして大量に検索することができる。そこで、検索された類似画像で隠蔽領域を完全に置き換えてしまうことで違和感の無い補完画像を生成するのだ。

  • コンピュータビジョン

    The Institute of Electronics, Information and Communication Engineers 電子情報通信学会誌Vol.83 No.1 pp.32-37 金出武雄 金出武雄:正員 カーネギーメロン大学ロボット工学研究所 E-mail tk@cs.cmu.edu Computer Vision. By Takeo KANADE, Member (The Robotics Institute, Carnegie Mellon University, Pittsburgh, Pennsylvania 15213-3890, U.S.A). 1. は じ め に ロボットを初めとする人工知能システムには外界の状況をセンサでもって理解する感知覚能力が欠かせない.中でも,画像を使って外界を認識する視覚能力は,人間の大脳の最も大きな部分を視覚野が占めることか

  • 画像研究入門

    【目次】 0.C言語基礎 0-1.当の基礎 0-2.配列とポインタ 0-3.文字列操作・ファイル操作 1.画像基礎 1-1.画像フォーマット 1-2.テキストとバイナリ 1-3.配列とポインタ 2.画像処理基礎 2-1.エッジ処理 2-2.背景差分処理 3.グラフ描画基礎 3-1.gunplot 3-2.折れ線グラフ 3-3.ヒストグラム表示 4.アルゴリズム基礎 4-1.k-平均アルゴリズム 4-2.EMアルゴリズム 5.画像表示基礎 5-1.OpenGL 5-2.OpenGLによる二次元表示 5-3.OpenGLによる三次元表示 はじめに これから画像処理・認識の研究を始めようという人を対象とした入門書を作っています.対象は研究室に配属されたばかりの情報系大学の4年生を想定していますが,誰が読んでも分かるように心がけているつもりです.読み進めながら課題を解いていくうちに画像の基礎知識

  • Computer Vision Online Publications

    References Computer Science Bibliography - Computer Graphics and Vision - Very large collection of bibliographies ( mirror site ). Computer Vision Wikicity - A wikipedia-style Computer Vision resource that anyone can view and edit. On-line Computer Science Tech Reports - all kinds, not just vision Rosenfeld Bibliographies index and search (US) - (text only), and BibTeX/ASCII versions SPIE Abstract

  • CVonline - Compendium of Computer Vision

    CVonline: The Evolving, Distributed, Non-Proprietary, On-Line Compendium of Computer Vision Overview CVonline is a resource for computer vision, machine vision, image analysis and some visual psychophysics and visual neurophysiology. The main elements are: a hierarchical index of topics with links into Wikipedia a set of non-Wikipedia content, including public datasets, free software, a list of im

  • TechCrunch | Startup and Technology News

    The RAW Dating App aims to shake up the dating scheme by shedding the fake, TikTok-ified, heavily filtered photos and replacing them with a more genuine, unvarnished experience. The app…

  • コンピュータビジョン

    コンピュータビジョン (ISBN978-4-320-12157-7) David A. Forsyth,Jean Ponce 著 大北 剛 訳 B5,826頁,14000円 ●内容 書はコンピュータビジョンの最前線で活躍するフォーサイス教授とポンス教授による快心の教科書の日語訳である。発売時に(草稿も含めて)ビジョン界の隅々にまで衝撃を与え,一躍にしてデフォルトスタンダードの教科書となった迫力は今や普遍的なものとなりつつある。ビジョン研究で展開する実にさまざまなアイデアが彼らのビジョン哲学に基づいた非常に鋭い切口で網羅され,どう個々の基礎事項に結びつけて理解すべきかが見事に説明される。「ビジョンのアイデア」に重点が置かれ,著者らの数学的な理解力の奥深さにより実に簡潔に説明される。現代のコンピュータビジョン(特に論文やソフトウェアでのカッティングエッジな技法を理解するための基

  • コンピュータビジョン特論

    コンピュータビジョン特論(Advanced Computer Vision)月曜2時限 担当教員 呉海元 教授・加藤丈和 講師 授業の概要 コンピュータを用いて、入力された画像を扱うための、基礎知識を修得する。まず、画像の特徴抽出と記述 の手法を学ぶ。次に,カメラを用いた3次元計測や認識の基礎を学び、それぞれの原理と手法の有効性や制約をコンピュータビジョンなどの関連分野での最新動向と共に紹介する。 授業の位置づけ コンピュータビジョンにおける画像処理や理解の技術について、基礎理論と最近の研究動向を学ぶ。 ガイダンス・画像処理、認識、理解研究の歴史と現状(加藤) デジタル画像の扱い・OpenCVの使い方(加藤) OpenCVの入手方法、インストール方法、リファレンス 画像特徴(点、直線、領域)の検出と識別−1 画像特徴(点、直線、領域)の検出と識別−2 画像特徴(点、直線、領域)の検出と識別

  • Caltech256

    View all the images . Please do not link directly to these images: it overloads our server.

  • Caltech101

    Description Pictures of objects belonging to 101 categories. About 40 to 800 images per category. Most categories have about 50 images. Collected in September 2003 by Fei-Fei Li, Marco Andreetto, and Marc 'Aurelio Ranzato.  The size of each image is roughly 300 x 200 pixels. We have carefully clicked outlines of each object in these pictures, these are included under the 'Annotations.tar'. There i

    Face Data CBCL FACE DATABASE #1: Includes complete Readme File 19 x 19 Grayscale PGM format images Training set:  2,429 faces, 4,548 non-faces Test set: 472 faces, 23,573 non-faces 27 Megabytes compressed : 110 Megabytes uncompressed tar / gz format compression READ ME (Includes references and pointers to some results using this data.) DOWNLOAD Copyright 2000 Center for Biological and Computationa

