ちょっとお仕事でFaceTrackerの論文を読む機会がありました。 FaceTrackerはConstrained Local Modelという手法を用いた顔の目、鼻、口などの特徴を検出して追跡してくれるソフトウェアで、動画をここで見ることができます。 というわけで、読んだ内容をまとめました。お客さんからも許可頂いたので公開しておきます。 201205016 deformablemodelfitting View more presentations from Minagawa Takuya
最近は画像認識・検索で用いられるデータセットも大規模化が進んでいます。 いくつか代表的なものや最近見つけたものをまとめてみます。 (ここでの目安は、教師つきデータは10万枚以上、教師なしデータは100万枚以上のもの) ImageNet http://www.image-net.org/ 自然言語処理の分野で有名なWordNetのオントロジーに従って、各単語(今のところ名詞のみ)に対応する画像を収集したものです。Amazon Mechanical Turk を利用し、質の高いデータセットを構築するように工夫されています。日々データは蓄積・更新されており、2012年1月現在、約1400万枚の画像データ(2万2千カテゴリ)が集まっているようです。 アノテーションは基本的に1画像1カテゴリで、一部の画像には物体の位置を示すbounding boxもついています。カテゴリによっては十分な数の画像がな
以前のエントリでも述べましたが、bag of visual words(BoVW)は一般物体認識における標準的な画像特徴表現であり、非常によく用いられます。ですが、BoVWはこの3年ほどで急速に進歩しており、よく見られる「k-meansでクラスタリング → ヒストグラム作成 → 非線形SVM」という定石は既に時代遅れのものとなりつつあります。 今日は、BoVWに関連する最近のトレンドをいくつか見てみたいと思います。実は、これは一般物体認識の大規模化と深い関わりがあります。古典的なBoVWでは非線形カーネルの利用が必要でしたが、最近の手法は線形識別器を直接適用できるように考えて設計されています。ここがうまくいけばあとは、いかにして大規模な線形識別器を学習するか、という機械学習やデータマイニング等でよく議論される問題まで落ちてきます。これにより、一般物体認識もかなり大きな規模のデータで学習・認
以前こちらの記事で紹介したマーカレスARのソースをGitHub上で公開しました。MITライセンスです。 こちらからダウンロードできます。 https://github.com/takmin/OpenCV-Marker-less-AR 本当はリファクタリングが終わってから公開しようと思っていたのですが、それを言っていたらいつまでたっても公開できなさそうなので、エイヤ!でアップロードしちゃいました。これから随時コードを整理していきたいと思っています。 このプログラムは 特定物体認識 トラッキング 重畳表示 の3つのパートに分かれていて、一応それぞれのアルゴリズムを入れ替えられるように作ってます。 言語はC++で書かれていて、以下のライブラリを使用しています。 OpenCV 2.3.1 https://sourceforge.net/projects/opencvlibrary/ GLUT 3.
6月2日に開催されたDevLOVEさんと弊社の共同開催勉強会で、「Android×ComputerVision」というお題で発表してきました。 要はOpenCVをAndroidアプリに組み込んで特定物体認識を試そう、というもの。 資料は以下です。 20110602_MTI×DevLOVE発表資料「Android×ComputerVision」 View more presentations from Takahiro Horikawa ソースはgithubで公開してます。 https://github.com/thorikawa/AndroidObjectRecognition/ 概要 資料にも記載していますが、カメラのプレビュー画像からSURFの特徴点を検出して、LSHで再近傍検索→特定物体認識というのを毎フレーム行っています。 「物体」はCDのジャケット画像を5枚の内から認識して、それ
CV勉強会参加者の皆さんお疲れ様でした。 それにしても、自分で決めたとは言え、僕の発表担当部分があまりに膨大でびっくりしました。 結局スライドは76枚に達し、二時間以上しゃべってました。 ただお陰さまで、色々な指摘を皆さんから頂き、大変勉強になりました。 というわけで、勉強会で指摘された内容を踏まえて修正した資料をアップします。 Chapter1 4.6 modView more presentations from takmin. 第2回はグラフカットやります。奮ってご参加下さい。 http://atnd.org/events/4160
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く