タグ

cvとOpenCVに関するbeth321のブックマーク (4)

  • コンピュータ・ビジョンの業界動向 | gihyo.jp

    あけましておめでとうございます。以前このgihyo.jpで「OpenCVで学ぶ画像認識」というタイトルで連載をさせていただいた皆川です。 今回、技術評論社様から「コンピュータ・ビジョンの今」についての執筆依頼をいただきました。私が普段ウォッチしている業界や技術分野には偏りがあるため、俯瞰的な形での解説は難しいかもしれませんが、私の独断と偏見で最近の動向についてまとめてみたいと思います。 ここでは、主に以下の3点について述べさせていただければと思います。 ビジネスでの動向 アカデミックでの動向 コミュニティでの動向 「コンピュータ・ビジョンってなに?」という方は、「⁠OpenCVで学ぶ画像認識」の第1回をお読みください。 ビジネスでの動向 拡張現実感(AR) 昨年、IT業界で間違いなく一つの流行語となったのは“⁠拡張現実感(AR: Augmented Reality)⁠”でしょう。ARは現実

    コンピュータ・ビジョンの業界動向 | gihyo.jp
  • 第1回 画像認識の基本を知ろう | gihyo.jp

    この連載では、この表で言う画像認識技術を主に扱いますが、どの技術も非常に活発に研究されており、様々な分野で実用化されています。 画像認識・理解の基原理 画像認識の基原理 画像認識は、学習のフェーズと認識のフェーズの2つからなります。学習のフェーズでは、コンピュータに認識させたい対象画像を学習させる処理を行い、認識のフェーズではコンピュータに入力画像が学習した対象かどうかを判定させます。 図5 学習と認識の流れ 学習フェーズ 学習のフェーズでは、まず画像になんらかの処理を施して、ピクセルのデータ列から、より学習に適したデータ列(特徴量データ)へと変換を行います。 次に変換されたデータを、機械学習と呼ばれるアプローチを用いてコンピュータに学習させます。機械学習とは、その名の通り人間が行っているような学習の仕組みをコンピュータに持たせるための技術です。例えば人間は、初めて見る人の顔画像でも、

    第1回 画像認識の基本を知ろう | gihyo.jp
  • 実践 コンピュータビジョン

    コンピュータビジョンの理論とアルゴリズムを基礎から学べる実践的な入門書。理論の説明にとどまらず、ベクトル演算や行列演算を駆使したサンプルを示しながら物体認識、3次元復元、ステレオ画像、拡張現実感、その他の応用について解説します。サンプルプログラムはPython 2.7で書かれています。OpenCVを使うだけではコンピュータビジョンの質を理解できません。forループでピクセルを操作し行列を計算する時代でもありません。Pythonの数値演算ライブラリを使えば、ほどよい粒度でコンピュータビジョンの基礎を学べます。各章末には演習問題が用意してあります。演習問題を解くことで自分がその章で何を学んだのか、また自分の理解度を確認できます。 ●書で扱うサンプルプログラムの説明(サンプルコードは「関連ファイル」タブページからダウンロード可)。 翻訳者の相川氏のブログには、書の追加情報や関連する技術情報

    実践 コンピュータビジョン
  • コンピュータビジョンのソースコード/ライブラリのまとめ - takminの書きっぱなし備忘録 @はてなブログ

    今まで自分が見つけたコンピュータビジョンの研究に役に立ちそうなフリーのライブラリやソースコードをまとめてみました。自分ではまだ使っていないものも多いので、そこはご容赦を。主にC/C++が中心です。 またライブラリ形式でない、いわゆる学会で発表した研究のコードをそのまま公開しているという人がたくさんいて、それに関しては特にメジャーなもののみ紹介しています。なにぶん僕の観測範囲は限られてますので、「このライブラリに触れないのはおかしい」、「説明が間違っている」等、ご意見大歓迎です。 定番(Standard) OpenCV 定番中の定番です。コンピュータビジョンに関して広範なアルゴリズムが実装されています。 http://code.opencv.org/projects/OpenCV/wiki/WikiStart Point Cloud Library 3次元点群データを扱うならこれ。Kinec

    コンピュータビジョンのソースコード/ライブラリのまとめ - takminの書きっぱなし備忘録 @はてなブログ
  • 1