タグ

画像認識に関するthorikawaのブックマーク (55)

  • http://www.isi.imi.i.u-tokyo.ac.jp/~harada/pdf/LargeScaleGenericImageRecognition_ImageRepresentation_prmu20110217_harada.pdf

  • AKAZE特徴量の紹介と他特徴量との比較 - 遥かへのスピードランナー

    1月6日追記:作者のPablo氏とメールのやり取りをする中で、当初掲載していたスピードのベンチマークはコンパイラの最適化オプションが指定されていなかったことに気づきましたので、最適化オプションを指定して再度計測し、結果を差し替えました。 2012年のComputer Vision Advent Calendarで、さかな前線 » ECCV2012で発表されたKAZE局所特徴量を試してみた という記事を見て以来、ずっと気になっていた、KAZE特徴量を自分でも使ってみようと色々試していたところ、KAZE特徴量を高速化したAKAZE特徴量が公開されていることに気づきました。 AKAZE Features Accelerated KAZEとかいうKAZEの高速化版がいつの間にか作られていた。動画を見る限り、リアルタイムの用途にも使えそう。試してみるか。 http://t.co/Q3mEMuaeV4

    AKAZE特徴量の紹介と他特徴量との比較 - 遥かへのスピードランナー
  • 論文『画像補完技術による衣服の除去』を刊行します | ぱろすけのメモ帳

    査読付き学術論文誌「あの人の研究論文集 Vol.4 No.2」に、私の執筆した論文「画像補完技術による衣服の除去」が採録されました。私が水面下で開発していた真に革新的なプロダクトに関するものです。人類のロマンであるところの、着衣の透視を実現します。具体的には、以下の画像のようなシステムを実現します。記事に掲載した画像には強いモザイクをかけていますが、実際の紙面ではモザイクはありません。(一部黒塗りがあります。)上の画像が二次元画像を用いた例、下の画像が三次元画像を用いた例です。この図ではモザイクが粗すぎてわかりにくいかもしれませんが、お察しください。英語力に自信がないのであれなのですが、論文の概要は以下の通りです。Abstract: This paper proposes a novel method to remove clothes in images. When an image

    論文『画像補完技術による衣服の除去』を刊行します | ぱろすけのメモ帳
  • 2012-02-04

    以前のエントリでも述べましたが、bag of visual words(BoVW)は一般物体認識における標準的な画像特徴表現であり、非常によく用いられます。ですが、BoVWはこの3年ほどで急速に進歩しており、よく見られる「k-meansでクラスタリング → ヒストグラム作成 → 非線形SVM」という定石は既に時代遅れのものとなりつつあります。 今日は、BoVWに関連する最近のトレンドをいくつか見てみたいと思います。実は、これは一般物体認識の大規模化と深い関わりがあります。古典的なBoVWでは非線形カーネルの利用が必要でしたが、最近の手法は線形識別器を直接適用できるように考えて設計されています。ここがうまくいけばあとは、いかにして大規模な線形識別器を学習するか、という機械学習やデータマイニング等でよく議論される問題まで落ちてきます。これにより、一般物体認識もかなり大きな規模のデータで学習・認

    2012-02-04
  • <4D6963726F736F667420506F776572506F696E74202D2091E58B4B96CD88EA94CA89E6919C94468EAF82C689E6919C955C8CBB5F947A957A97702E70707478>

    パターン認識・メディア理解研究会 2月17日 大規模一般画像認識と画像表現 Large-Scale Generic Image Recognition and Image Representation and Image Representation 東京大学/JSTさきがけ 原田達也 1 Flickr reached 5,000,000,000 photos on September 19, 2010.  http://blog.flickr.net/en/2010/09/19/5000000000/ 2 The Growth of Flickr • Over 5,000,000,000 photos • 4,596 uploads in the last minute in last minute • 134,362,183 geotagged items http://

  • http://storage.osdev.info/pub/idmjt/diaryimage/0901/neta090130l1.pdf

  • bayonを使って画像からbag-of-keypointsを求める - のんびり読書日記

    クラスタリングツールbayonとOpenCVを使って、画像からbag-of-keypointsを特徴量として抽出する手順について書きたいと思います。bag-of-keypointsは自然言語処理でよく使用されるbag-of-words(文章を単語の集合で表現したもの)と同じようなもので、画像中の局所的な特徴量(keypoint)の集合で画像の特徴を表します。bag-of-wordsと同じ形式ですので言語処理と同じように、bag-of-keypointsデータを使ってクラスタリングツールに適用したり、転置インデックスに載せたりといったことが可能になります。 今回は画像からbag-of-keypointsを取り出し、そのデータを使ってbayonで画像集合をクラスタリングするところまでやってみます。ちなみに画像処理は完全に素人で、この記事もニワカ知識で書いているので、間違っている箇所やもっと効率

    bayonを使って画像からbag-of-keypointsを求める - のんびり読書日記
  • HugeDomains.com

    Captcha security check srengine.com is for sale Please prove you're not a robot View Price Processing

    HugeDomains.com
    thorikawa
    thorikawa 2010/12/12
    風景認識エンジン
  • Visual Wordsを用いた類似画像検索 - 人工知能に関する断創録

    類似画像検索システムを作ろう(2009/10/3) 3日で作る高速特定物体認識システム(2009/10/18) に続くOpenCVプロジェクト第三弾です。今回は、上の二つをふまえてカラーヒストグラムではなく、局所特徴量(SIFTやSURF)を用いた類似画像検索を試してみます。局所特徴量はグレースケール画像から抽出するため、カラーヒストグラムと違って色は見ていません。画像の模様(テクスチャ)で類似性を判定します。 実験環境は、Windows 7、MinGW C++コンパイラ、OpenCV2.0、Python 2.5です。EclipseでMinGWを使う方法はEclipseでOpenCV(2009/10/16)を参照してください。Visual C++にはないディレクトリスキャン関数を一部使っているのでVisual C++を使う場合は、少しだけ修正が必要です。 Bag-of-Visual Wor

    Visual Wordsを用いた類似画像検索 - 人工知能に関する断創録
  • 講義情報 (2020年度) - 東北大学 鏡 慎吾

    [ 2005 | 2006 | 2007 | 2008 | 2009 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 | 2023年度 ] このページには学外向けの公開情報のみを掲載しています. 受講に当たっては各講義の Google Classroom を参照してください. Please check out the Google Classrooom of each class for latest information. 情報科学基礎I (学部3年 第1クォーター,月曜3限/水曜2限) 2クラス並行のうち B2,C1,C2 クラスを担当します. 講義は対面で行われ,資料や課題は Google Classroom で配布されます. 必要に応じて以下の過去

  • Pattern Information Processing

    (ミニクイズの解答と解説) 問1.1-問1.2(解答例)| (5/27 解答例)| (6/11 解答例)| (7/2 解答例) リンク OpenCV;Open Source Computer Vision Library(Intel) OpenCVインストール法,etc.(奈良先端大) OpenCV-japan(マニュアル日語訳,サンプルソースコード,etc.) 画像処理に関するチュートリアル 画像ファイルのフォーマット | 画像ファイルのフォーマット(ppm/pgm)(簡単な解説) (Windowsでよく使われる)BMPについての解説(詳細なコメント) 音声ファイルのフォーマット(WAV) | 音声ファイルのフォーマット(AIFF) SPWAVE(坂野秀樹氏らによるツール) SIFT Key Points Detector(特徴抽出と照合の例; David Lowe's

    thorikawa
    thorikawa 2009/12/01
    埼玉大学前川先生講義資料
  • 無題ドキュメント

    画像処理論 2008年冬学期 講義のレポートの提出期限:2月13日(金)(厳守) 内容および提出方法については第11回講義資料最後の部分を確認のこと Gradient Domain High Dynamic Range Compression Motion Deblurring Using Hybrid Imaging Image Completion with Structure Propagation PCA-SIFT: A More Distinctive Representation for Local Image Descriptors Photo Tourism: Exploring Photo Collections in 3D 第1回:講義の概略と「画像のデジタル化」 平成20年10月8日 講義スライド:配布資料 参考資料:谷口2章、BB 2.2

    thorikawa
    thorikawa 2009/12/01
    東大佐藤先生の画像処理論講義スライド
  • (前回〜10/25) - デー

    破滅してる。欲を出していろいろよくしようと思ったけど、まじめに考えるといろいろありすぎてちょっとヤバイ。 まあこれは勉強のチャンスであるので、もう少しやってみようと思う。 考えが変わったところ 人率にこだわっていたけど、これは教師ありでやるべきだし、教師データは今地道に作っている(昨日がんばって60人分のラベル付き顔[髪型]画像各人100〜130枚作った。もとデータはあと150人分あるので健全な精神と引き換えに教師データを作る)ので、それができてからやろうと思った。 類似検索は、人とかどうでもよくて、人間の感覚で似てると思うのを表示するようにしようと思う。この感覚は心理的には少し難しくて、たとえば知っている同じキャラ(人)ならあまり似ていないシーンの画像でも似ていると強く思ってしまうことがあるので、「顔が似ている」といったことは書かなくて、「髪形のみ似ている」とか「魂の色が似ている」

    (前回〜10/25) - デー
    thorikawa
    thorikawa 2009/11/28
    ベクトル量子化とかよくわからんー⇒分かった。
  • 3日で作る高速特定物体認識システム (1) 物体認識とは - 人工知能に関する断創録

    情報処理学会の学会誌『情報処理』の2008年9月号(Vol.49, No.9)に「3日で作る高速特定物体認識システム」という特集記事があります。OpenCVを用いた面白そうなプロジェクトなのでレポートにまとめてみようと思います。3日でできるかはわからないけど。 残念ながらこの記事はPDFを無料でダウンロードすることができません(CiNiiでオープンアクセス可能になったみたいです)。なので会員以外で元記事が読みたい人は図書館でコピーする必要があるかも・・・また、2009年9月号の人工知能学会誌にも物体認識の解説「セマンティックギャップを超えて―画像・映像の内容理解に向けてー」があります。こちらも非常に参考になりますが同様にPDFが手に入りません・・・。他にもいくつかわかりやすい総説論文へのリンクを参考文献にあげておきます。 物体認識とは 物体認識(object recognition)は、画

    3日で作る高速特定物体認識システム (1) 物体認識とは - 人工知能に関する断創録
  • 3日で作る高速特定物体認識システム

    3日で作る高速特定物体認識システム 黄瀬浩一,岩村雅一 (大阪府立大学) 1.システム構成 2.システムの作成 2.1 特徴抽出モジュール 利用するプログラム A C implementation of SIFT by Rob Hess 環境設定 OpenCV 全体のページ インストールの方法: 例えばこのページ. Visual Studio(2005, or 2008) 設定の方法: 例えばこのページ. 参考文献 藤吉先生による日語の解説: 分かりやすい. Wikipedia: リンクが豊富. Lowe教授のページ: 家.手軽に試せるプログラムもある.Matlabバージョンは非常に簡単. 2.2 物体モデル 物体モデルといっても特別な仕掛けがあるわけではなく, <物体ID> <特徴ベクトル(128個の数字)> が特徴ベクトルの個数だけ並んだ1つのファイルです. x行目は,特徴ベクトル

  • MNISTをSURFを使ったbag of keypointsで - デー

    とにかく早く動かす欲で半分くらい想像でやってしまったので、誤りがあれば指摘などなど。 SURFとは! SURFは回転とスケールに不変な特徴点検出アルゴリズムで、keypoints(点の位置とスケール)とdescriptor(正規化された勾配のヒストグラム)を得ることができる。 このdescriptorsを画像の局所的な(画像パッチの)特徴ベクトルと考えると、画像に含まれるSURF Descriptorの集合を(十分大きければ)画像のidentificationとすることができる。 大まかな内容 MNISTの学習データからSURF Descriptorを抽出する ベクトル量子化のためのコードブックを作成する 抽出したSURF Descriptorをk個にクラスタリングする 各クラスの重心をコードベクトルとし、クラスをvisual-wordという単語の単位にする 画像をグローバルな単語の集合と

  • PowerPoint Presentation

  • A trainable feature extractor for handwritten digit recognition

    thorikawa
    thorikawa 2009/10/13
    Le-Net5の解説もあり
  • OCRはどのように間違いを犯すのか? - 電子化

    さて、JPEG2000に関する小難しい話*1が続いていますので、ちょっと休憩です。 日のお題画像 日は、OCRについて、お話します。 (http://denshika.cc/faq/faq4.phpも参照してください。) OCRの技術を簡単に説明しますと、こんな紙面の画像があるとしますと、 http://chroniclingamerica.loc.gov/lccn/sn83030272/1879-07-01/ed-1/seq-1/ 赤丸の記事に該当する部分を抜き出して、 さらに、1行を抜き出して、 さらに、単語を抜き出して、 さらに、文字単位に切り分けます。 ここまで来たら、各文字が、それぞれ何か、ということを計算します。 普通に1文字づつ計算をしていくと、たとえば、  を  と勘違いしたり、  を  と勘違いしたりします。 なので、上の「PIECES」という単語を と勘違いする可能

  • Python: 画像で与えられた迷路に対し2点間の最短経路を求める

    迷路の描かれた画像に対して、ピクセルの座標で指定したスタート地点とゴール地点の最短経路を求めるプログラムをPython+PILで書いてみた。使用する画像は、デジカメで撮ったものでも、ウェブから拾ってきたものでも、ペイントソフトで自作したものでも構わない。 まずは使用例を見て欲しい。この画像は携帯カメラで撮った自作の簡単な迷路だ(画像上)。それに対して指定した2点間の最短経路を赤線で示してみた(画像下)。ピクセル単位で計測しているので赤線が若干ガタガタしていて完全な最短経路ではないがほぼ最短と考えていいだろう。迷路画像(画像上)をmaze01.jpgとし、スタート地点の座標が(240, 160)、ゴール地点の座標が(210, 400)の場合、コマンドラインで以下のように実行する。 maze_solver.py maze01.jpg -s 240 160 -g 210 400 これで最短経路を

    Python: 画像で与えられた迷路に対し2点間の最短経路を求める