タグ

ブックマーク / rest-term.com (8)

  • JavaScriptでステレオ画像処理 – Rest Term

    過去、OpenCVやFlashで簡単なステレオ画像処理を試してきましたが (ステレオ画像処理, Flashでステレオビジョン入門)、今回はJavaScriptとCanvas APIで同じものを作ってみます。 Demo: HTML5 Stereo Vision Source Code: cv/stereo_matching at master from wellflat/jslib – GitHub ここではKinectのように赤外線センサーはもちろん利用できないので、純粋な画像解析のみで奥行きを計算します。 2枚の画像でステレオマッチングを行い、カメラから対象までの距離を濃淡で表す視差マップ (深度マップや距離画像と呼ばれることもある、CGの視差マッピングとは別物)を生成します。使用するアルゴリズムはこれまで同様にブロックマッチングを、類似度評価にはSAD(Sum of Absolute

    JavaScriptでステレオ画像処理 – Rest Term
    lanius
    lanius 2014/10/08
    ブロックマッチング法、SAD。
  • ねこと画像処理 part 3 – Deep Learningで猫の品種識別 – Rest Term

    ねこと画像処理。 (みかん – 吉祥寺 きゃりこ) 前回の ねこと画像処理 part 2 – 検出 では画像内のの顔を検出する方法を紹介しましたが、今回はディープラーニングの技術を用いての品種を識別したいと思います。 学習データ ねこと画像処理 part 1 – 素材集めでは、自分で撮影した写真を学習データとして使うと書いたのですが、都内のカフェ等で出会えるに限ってしまうと品種の偏りが大きくなってしまうので、ここではしぶしぶ研究用のデータセットを使うことにします。。ただ、Shiba Inuがあるのに日が誇るMike Nekoが含まれていないのでデータセットとしての品質は悪いと思います。 The Oxford-IIIT-Pet dataset オックスフォード大学が公開している動物画像のデータセットです。その内画像は2400枚、クラス数は12で1クラスにつき200枚あります。今

    ねこと画像処理 part 3 – Deep Learningで猫の品種識別 – Rest Term
  • ねこと画像処理 part 2 – 猫検出 (モデル配布) – Rest Term

    ねこと画像処理。 (アイシャ – 池袋 ねころび) 前回のねこと画像処理 part 1 – 素材集めでは画像の集め方について整理しました。今回はその集めた画像を使って検出用の学習モデル(分類器)を作成したいと思います。それにはいろいろと準備が必要です。 モデル(分類器)の配布についてはこのエントリーの後半で説明します。 アノテーションデータの収集 学習モデルを作る前にのどの部分を検出するかを決める必要がありますが、今回はの顔(頭)部分の検出を行おうと思います。そのためのアノテーションデータ作成補助ツールを作成したのでそれを使ってひたすらデータを集めます。僕一人の作業だと限界があったのですが、クラウドソーシングによりネット上の顔も知らない有志達の協力のおかげであっという間にデータが集まりました。 アノテーションデータ作成補助ツールの作成にあたっては以下のサイトを参考にさせてもらいま

    ねこと画像処理 part 2 – 猫検出 (モデル配布) – Rest Term
  • 機械学習ライブラリ SHOGUN入門 – Rest Term

    The machine learning toolbox’s focus is on large scale kernel methods and especially on Support Vector Machines (SVM) * The SHOGUN Machine Learning Toolbox サイトのデザインどうにかしたらいいのにとか将軍ってなんだよとかいろいろあるかと思いますけども、プロダクトとしては素晴らしいという噂を聞くので今回このSHOGUNという機械学習ライブラリを試してみました。目的は一般物体認識における分類タスクでMultiple Kernel Learning(MKL)やLatent SVMの実装を試すことなのですが、まずはインストール方法と簡単な使い方を調べるところから始めます。 また、この記事の内容はQiitaにも投稿しています。 * 機械学習ライブラ

    機械学習ライブラリ SHOGUN入門 – Rest Term
  • JavaScriptでPoisson Image Editingによる滑らかな画像合成 – Rest Term

  • MongoDB GridFSについて – Rest Term

    今回はMongoDBのGridFSを少しだけ触ってみました。 This allows us to efficiently store large objects, and in the case of especially large files, such as videos, permits range operations (e.g., fetching only the first N bytes of a file). MongoDBはデータをBSONと呼ばれる形式で扱っていますが、一つのBSONオブジェクトに対して16MBの制限(v1.7未満のバージョンだと4MB)があるようです。GridFSはMongoDBに巨大なファイルを格納するための仕様で、公式でも上記引用の通り動画像ファイルなどを扱うことを想定しているので、ここでは動画配信サービスのバックエンドの一部に使えるかどうか考

    MongoDB GridFSについて – Rest Term
    lanius
    lanius 2012/04/16
    「MongoDBに巨大なファイルを格納するための仕様」。
  • Flash, HTML5 Canvas + OpenCV – Rest Term

    前回はWSGIアプリケーションからOpenCVを利用する例を挙げましたが、今回はクライアントをFlashとHTML5の両方で試してみます。といっても特別なことをする必要はなくて、公開されたURIからリソースを取得すればいいだけです。 、、 ということで既に先が見えて飽きてしまいましたが、簡単なデモと方針だけでも気力を振り絞って書いておきます。後はアプリ層の方々におまかせ;; OpenCVPythonバインディングを使いますので、この部分は前回と同じくFlaskを使うことにします。クライアントがFlashの場合はテンプレートエンジン不要で、URIルーティングを行うためのWerkzeugがあれば十分です。ただ、Flaskなら情熱がなくてもたぶん最後まで書ききれるのでオススメ。最後に処理結果ですが、今回はStar Detectorのデモを作ろうと思うので、以下のようなJSON形式で返すことにし

    Flash, HTML5 Canvas + OpenCV – Rest Term
  • さくらVPSにOpenCVをインストールしてPythonから使う – Rest Term

    OpenCV2.2をさくらVPS(CentOS 5.5)にインストールして、 PythonバインディングをWSGIアプリケーション(mod_wsgi)から使ってみます。 構築手順はOpenCV – 2.x – Tech Noteに書いておいたので参考までに。 OpenCV2.2からはNumPyを利用したPythonインタフェースを利用できるようになりました。 画像データを通常のNumPy配列(numpy.ndarray)として扱えるので大変便利です。 Pythonバインディング (NumPy利用) $ python Python 2.7.1 (r271:86832, Feb 18 2011, 03:06:36) [GCC 4.4.0 20090514 (Red Hat 4.4.0-6)] on linux2 Type "help", "copyright", "credits" or "l

    さくらVPSにOpenCVをインストールしてPythonから使う – Rest Term
    lanius
    lanius 2011/04/04
    Flask.
  • 1