皆様はコンピュータビジョンという用語をご存知でしょうか。例えばデジタルカメラに搭載されている顔画像認識や、Google Street Viewの360度パノラマ表示、XBox360のKinectによるプレイヤーのジェスチャー認識など、これらは全てコンピュータビジョンの技術による製品です。
世の中はビッグデータ一色のようですね。コンピュータビジョン界隈でも大量の画像データで何が出来るかは盛んに議論されています。今日は有名なのを軽くまとめてみたいと思います。 画像内容認識 一番分かりやすいのは、大量のラベル付画像データを用いたパターン認識です。"More data beats better algorithm" はあちこちで言われていますが、画像認識の分野もこの方向へ進んでいます。あまり面倒くさいことしなくても、単純なノンパラメトリック手法(k最近傍法とか)で十分なんじゃないか、みたいなお話です。 いろいろあるのですが、特に有名なのはMITのTorralbaさんの研究でしょうか。 A. Torralba, R. Fergus, W. T. Freeman, 80 million tiny images: a large dataset for non-parametric ob
Next: はじめに 知能化視覚システム 熊本大学 工学部 山口 晃生 (注)本資料は1993年度SICE九州フォーラム資料をHTMLに改変したものです はじめに センサの知能化 視覚の知能化 ロボットビジョン 生体視覚 知能化の必要性 視覚の知能化に関連する研究 Active Perception Animate Vision Active Vision 視覚の基礎機能と高次機能 従来の速度計算アルゴリズム 変位量探索による方法 相関法 基本原理 相互相関関数計算の問題点 Reichardtモデル 2次元領域の連続場への拡張 光センサアレイからなる相関器 相関法の問題点 空間フィルタ法 基本原理 空間フィルタ法の問題点 時空間微分法 時空間微分法 基本原理 速度場の空間的変動の滑らかさを仮定 局所的速度の一様性を仮定 輝度の2階微分を利用する方法 基本原理 輝度勾配の不変性の仮定
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く