[B! CV] sleepy_yoshiのブックマーク

FaceTrackerの論文を読んでみた："Deformable Model Fitting by Regularized Landmark Mean-Shift" - takminの書きっぱなし備忘録 @はてなブログ

ちょっとお仕事でFaceTrackerの論文を読む機会がありました。 FaceTrackerはConstrained Local Modelという手法を用いた顔の目、鼻、口などの特徴を検出して追跡してくれるソフトウェアで、動画をここで見ることができます。というわけで、読んだ内容をまとめました。お客さんからも許可頂いたので公開しておきます。 201205016 deformabl emodelfitting View more presentations from Minagawa Takuya

sleepy_yoshi 2012/05/17

CV

リンク

大規模画像データセット - n_hidekeyの日記

最近は画像認識・検索で用いられるデータセットも大規模化が進んでいます。いくつか代表的なものや最近見つけたものをまとめてみます。（ここでの目安は、教師つきデータは10万枚以上、教師なしデータは100万枚以上のもの） ImageNet http://www.image-net.org/ 自然言語処理の分野で有名なWordNetのオントロジーに従って、各単語（今のところ名詞のみ）に対応する画像を収集したものです。Amazon Mechanical Turk を利用し、質の高いデータセットを構築するように工夫されています。日々データは蓄積・更新されており、2012年1月現在、約1400万枚の画像データ（2万2千カテゴリ）が集まっているようです。アノテーションは基本的に1画像1カテゴリで、一部の画像には物体の位置を示すbounding boxもついています。カテゴリによっては十分な数の画像がな

sleepy_yoshi 2012/02/05

dataset
CV

リンク

2012-02-04

以前のエントリでも述べましたが、bag of visual words（BoVW）は一般物体認識における標準的な画像特徴表現であり、非常によく用いられます。ですが、BoVWはこの３年ほどで急速に進歩しており、よく見られる「k-meansでクラスタリング → ヒストグラム作成 → 非線形SVM」という定石は既に時代遅れのものとなりつつあります。今日は、BoVWに関連する最近のトレンドをいくつか見てみたいと思います。実は、これは一般物体認識の大規模化と深い関わりがあります。古典的なBoVWでは非線形カーネルの利用が必要でしたが、最近の手法は線形識別器を直接適用できるように考えて設計されています。ここがうまくいけばあとは、いかにして大規模な線形識別器を学習するか、という機械学習やデータマイニング等でよく議論される問題まで落ちてきます。これにより、一般物体認識もかなり大きな規模のデータで学習・認

sleepy_yoshi 2012/02/04

リンク

OpenCVでマーカレスAR - takminの書きっぱなし備忘録 @はてなブログ

以前こちらの記事で紹介したマーカレスARのソースをGitHub上で公開しました。MITライセンスです。こちらからダウンロードできます。 https://github.com/takmin/OpenCV-Marker-less-AR 本当はリファクタリングが終わってから公開しようと思っていたのですが、それを言っていたらいつまでたっても公開できなさそうなので、エイヤ！でアップロードしちゃいました。これから随時コードを整理していきたいと思っています。このプログラムは特定物体認識トラッキング重畳表示の３つのパートに分かれていて、一応それぞれのアルゴリズムを入れ替えられるように作ってます。言語はC++で書かれていて、以下のライブラリを使用しています。 OpenCV 2.3.1 https://sourceforge.net/projects/opencvlibrary/ GLUT 3.

sleepy_yoshi 2012/01/31

AR
CV

リンク

AndroidとOpenCVで試す特定物体認識 - 遥かへのスピードランナー

6月2日に開催されたDevLOVEさんと弊社の共同開催勉強会で、「Android×ComputerVision」というお題で発表してきました。要はOpenCVをAndroidアプリに組み込んで特定物体認識を試そう、というもの。資料は以下です。 20110602_MTI×DevLOVE発表資料「Android×ComputerVision」 View more presentations from Takahiro Horikawa ソースはgithubで公開してます。 https://github.com/thorikawa/AndroidObjectRecognition/ 概要資料にも記載していますが、カメラのプレビュー画像からSURFの特徴点を検出して、LSHで再近傍検索→特定物体認識というのを毎フレーム行っています。「物体」はCDのジャケット画像を5枚の内から認識して、それ

sleepy_yoshi 2011/06/27

android
CV

リンク

一般物体認識や類似画像検索に紛れ込んだ迷信？についての議論

Toshikazu Wada @toshikazuwada 顔画像認識とか，一般物体認識とか，類似画像検索とか，こういう研究分野に，色んな迷信が紛れ込んでるような気がする． 2011-02-20 22:10:08 Akisato Kimura @_akisato えっ、なんですか？きになります　RT @toshikazuwada: 顔画像認識とか，一般物体認識とか，類似画像検索とか，こういう研究分野に，色んな迷信が紛れ込んでるような気がする． 2011-02-20 22:12:57

sleepy_yoshi 2011/02/22

CV
togetter

リンク

IDEA * IDEA

ドットインストール代表のライフハックブログ

sleepy_yoshi 2010/11/05

リンク

CV勉強会に参加してきました - takminの書きっぱなし備忘録 @はてなブログ

CV勉強会参加者の皆さんお疲れ様でした。それにしても、自分で決めたとは言え、僕の発表担当部分があまりに膨大でびっくりしました。結局スライドは７６枚に達し、二時間以上しゃべってました。ただお陰さまで、色々な指摘を皆さんから頂き、大変勉強になりました。というわけで、勉強会で指摘された内容を踏まえて修正した資料をアップします。 Chapter1 4.6 modView more presentations from takmin. 第２回はグラフカットやります。奮ってご参加下さい。 http://atnd.org/events/4160

sleepy_yoshi 2010/04/19

CV

リンク

はてなブックマーク

タグ

関連タグで絞り込む (7)

CVに関するsleepy_yoshiのブックマーク (8)

お知らせ

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス