laniusのブックマーク - はてなブックマーク

JavaScriptでステレオ画像処理 – Rest Term

過去、OpenCVやFlashで簡単なステレオ画像処理を試してきましたが (ステレオ画像処理, Flashでステレオビジョン入門)、今回はJavaScriptとCanvas APIで同じものを作ってみます。 Demo: HTML5 Stereo Vision Source Code: cv/stereo_matching at master from wellflat/jslib – GitHub ここではKinectのように赤外線センサーはもちろん利用できないので、純粋な画像解析のみで奥行きを計算します。 2枚の画像でステレオマッチングを行い、カメラから対象までの距離を濃淡で表す視差マップ (深度マップや距離画像と呼ばれることもある、CGの視差マッピングとは別物)を生成します。使用するアルゴリズムはこれまで同様にブロックマッチングを、類似度評価にはSAD（Sum of Absolute

lanius 2014/10/08

ブロックマッチング法、SAD。

画像処理

リンク

ねこと画像処理 part 3 – Deep Learningで猫の品種識別 – Rest Term

ねこと画像処理。 (みかん – 吉祥寺きゃりこ) 前回のねこと画像処理 part 2 – 猫検出では画像内の猫の顔を検出する方法を紹介しましたが、今回はディープラーニングの技術を用いて猫の品種を識別したいと思います。学習データねこと画像処理 part 1 – 素材集めでは、自分で撮影した写真を学習データとして使うと書いたのですが、都内の猫カフェ等で出会える猫に限ってしまうと品種の偏りが大きくなってしまうので、ここではしぶしぶ研究用のデータセットを使うことにします。。ただ、Shiba Inuがあるのに日本が誇るMike Nekoが含まれていないのでデータセットとしての品質は悪いと思います。 The Oxford-IIIT-Pet dataset オックスフォード大学が公開している動物画像のデータセットです。その内猫画像は2400枚、クラス数は12で1クラスにつき200枚あります。今

lanius 2014/08/28

機械学習

リンク

ねこと画像処理 part 2 – 猫検出 (モデル配布) – Rest Term

ねこと画像処理。 (アイシャ – 池袋ねころび) 前回のねこと画像処理 part 1 – 素材集めでは猫画像の集め方について整理しました。今回はその集めた猫画像を使って猫検出用の学習モデル(分類器)を作成したいと思います。それにはいろいろと準備が必要です。モデル(分類器)の配布についてはこのエントリーの後半で説明します。アノテーションデータの収集学習モデルを作る前に猫のどの部分を検出するかを決める必要がありますが、今回は猫の顔(頭)部分の検出を行おうと思います。そのためのアノテーションデータ作成補助ツールを作成したのでそれを使ってひたすらデータを集めます。僕一人の作業だと限界があったのですが、クラウドソーシングによりネット上の顔も知らない有志達の協力のおかげであっという間にデータが集まりました。アノテーションデータ作成補助ツールの作成にあたっては以下のサイトを参考にさせてもらいま

lanius 2014/05/20

画像処理

リンク

機械学習ライブラリ SHOGUN入門 – Rest Term

The machine learning toolbox’s focus is on large scale kernel methods and especially on Support Vector Machines (SVM) * The SHOGUN Machine Learning Toolbox サイトのデザインどうにかしたらいいのにとか将軍ってなんだよとかいろいろあるかと思いますけども、プロダクトとしては素晴らしいという噂を聞くので今回このSHOGUNという機械学習ライブラリを試してみました。目的は一般物体認識における分類タスクでMultiple Kernel Learning(MKL)やLatent SVMの実装を試すことなのですが、まずはインストール方法と簡単な使い方を調べるところから始めます。また、この記事の内容はQiitaにも投稿しています。 * 機械学習ライブラ

lanius 2013/11/18

リンク

JavaScriptでPoisson Image Editingによる滑らかな画像合成 – Rest Term

lanius 2013/08/09

画像処理

リンク

MongoDB GridFSについて – Rest Term

今回はMongo DBのGridFSを少しだけ触ってみました。 This allows us to efficiently store large objects, and in the case of especially large files, such as videos, permits range operations (e.g., fetching only the first N bytes of a file). Mongo DBはデータをBSONと呼ばれる形式で扱っていますが、一つのBSONオブジェクトに対して16MBの制限(v1.7未満のバージョンだと4MB)があるようです。GridFSはMongo DBに巨大なファイルを格納するための仕様で、公式でも上記引用の通り動画像ファイルなどを扱うことを想定しているので、ここでは動画配信サービスのバックエンドの一部に使えるかどうか考

lanius 2012/04/16

「MongoDBに巨大なファイルを格納するための仕様」。

データベース

リンク

Flash, HTML5 Canvas + OpenCV – Rest Term

前回はWSGIアプリケーションからOpenCVを利用する例を挙げましたが、今回はクライアントをFlashとHTML5の両方で試してみます。といっても特別なことをする必要はなくて、公開されたURIからリソースを取得すればいいだけです。、、ということで既に先が見えて飽きてしまいましたが、簡単なデモと方針だけでも気力を振り絞って書いておきます。後はアプリ層の方々におまかせ;; OpenCVはPythonバインディングを使いますので、この部分は前回と同じくFlaskを使うことにします。クライアントがFlashの場合はテンプレートエンジン不要で、URIルーティングを行うためのWerkzeugがあれば十分です。ただ、Flaskなら情熱がなくてもたぶん最後まで書ききれるのでオススメ。最後に処理結果ですが、今回はStar Detectorのデモを作ろうと思うので、以下のようなJSON形式で返すことにし

lanius 2011/04/14

リンク

さくらVPSにOpenCVをインストールしてPythonから使う – Rest Term

OpenCV2.2をさくらVPS(CentOS 5.5)にインストールして、 PythonバインディングをWSGIアプリケーション(mod_wsgi)から使ってみます。構築手順はOpenCV – 2.x – Tech Noteに書いておいたので参考までに。 OpenCV2.2からはNumPyを利用したPythonインタフェースを利用できるようになりました。画像データを通常のNumPy配列(numpy.ndarray)として扱えるので大変便利です。 Pythonバインディング (NumPy利用) $ python Python 2.7.1 (r271:86832, Feb 18 2011, 03:06:36) [GCC 4.4.0 20090514 (Red Hat 4.4.0-6)] on linux2 Type "help", "copyright", "credits" or "l

lanius 2011/04/04

Flask.

Python

リンク

はてなブックマーク

タグ

ブックマーク / rest-term.com (8)

お知らせ

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス