タグ

画像処理に関するkei_keiのブックマーク (45)

  • Videolectures

  • CiNii 論文 -  アニメにおける人物顔画像の萌え因子特徴評価と検索分類システムへの応用(ITS画像処理,映像メディア,視覚および一般)

    JaLC IRDB Crossref DataCite NDL NDL-Digital RUDA JDCat NINJAL CiNii Articles CiNii Books CiNii Dissertations DBpedia Nikkei BP KAKEN Integbio MDR PubMed LSDB Archive 極地研ADS 極地研学術DB 公共データカタログ ムーンショット型研究開発事業

  • スパース行列(SparseMat)の使い方2:超解像 | opencv.jp

    SparseMatをつかった超解像処理を行います.このデモンストレーションは下記論文の実装になっています.詳細は以下論文やビデオをご覧ください. Farsiu, S.,Robinson, D., Elad, M., Milanfar, P.”Fast and robust multiframe super resolution,” IEEETrans.ImageProcessing 13 (2004)1327?1344. C++ //Super resolution with Bilateral Total Variation //Implimentation of a paper; //Farsiu, S.,Robinson, D., Elad, M., Milanfar, P."Fast and robust multiframe super resolution," IEEETran

  • 融けるような視点移動効果を実現する三次元再構築手法 Ambient Point Clouds - A Successful Failure

    いよいよ今年もSIGGRAPHが始まる時期となった。エントリでは、ダルムシュタット工科大学 (TUD) とマイクロソフトの合同チームによる、"Ambient Point Clouds for View Interpolation"と題されたtechnical paperから魔法のような視点補間技術を紹介したい。 まず、デモビデオをご覧いただくのが良いだろう。最初の方は既存手法の説明となっているが、目的は複数の写真をシームレスにつないで、破綻なく別視点に移動できる3次元モデルを再構築することである。02:44あたりから手法の適用結果が示されているので、まずそこを御覧頂きたい。これは、たとえばFlickrから集めてきた写真(当然カメラ位置も不明)から一切人の手を経ず全自動で生成されるのだ。 以下、論文*1に従って手法の概要について説明を行う。エントリで扱う図表は論文からの引用である。例に

    融けるような視点移動効果を実現する三次元再構築手法 Ambient Point Clouds - A Successful Failure
  • 画像検索技術に関するまとめ資料 - 横転プログラミング

    画像検索についていろいろとちょっとした実装や調査をしていました。 そろそろ資料等をまとめておかないと忘れそうなので書いておきます。 まずさっそくですが「画像を検索する」と一言でいっても、 それには以下のような種類があり、対象や方法は様々です。 類似画像検索 …… 対象画像から特徴を抽出し類似した画像を検索する 特定物体認識 …… 単一の対象画像から特徴を抽出しその物体と同じモノを認識 一般物体認識 …… 複数の対象画像から特徴を学習しその物体と同じ種類を認識 「類似画像検索」は Google Goggle などが有名で、「一般物体認識」は笑い男ツールなどの顔認識でよく知られていますね。「特定物体認識」はまだそこまでポピュラーに使われてませんが、東のエデンシステムなどはまさにこれです(笑)。 さてではどのような方法で検索を行うかということですが、ここで画像の特徴といっている、これを使います。

    画像検索技術に関するまとめ資料 - 横転プログラミング
  • 公式サイト - 360度パノラマカメラ

    全方位カメラという、丸い鏡を使ってパノラマ撮影を行う機材に興味を持ったのだが、非常に高かった。 なので、自分で作ってみた。目標としては、パノラマ撮影ができる機材を、できるだけ簡単に安く作ることである。 まず、実際に全方位画像を作れるかどうかを試してみた。 某研究室にあるちゃんとした全方位カメラを観察してみたところ、 中央真上からカメラで撮影しているミラーは三角錐か、半球の形(当は双曲面だったらしい)だった。このため、「真上から半球みたいな形をしたものを撮影すれば、それっぽい絵になる」と思い、料理用のボウルを手に入れることを考えた。 材料としては、夜のため主にダイソーで 料理用ボウル(300円)クリスマスツリーの飾りの丸くてキラキラしたやつ(100円)を調達。立ち寄ったカフェでおもむろにiPhoneで上から撮影し、GIMPでボウル部分を切り出した後にプログラムを組んで、パノラマ画像にしてみ

    公式サイト - 360度パノラマカメラ
  • 顔認識APIを無料公開 商用利用もOK

    ソフトウェア開発のインクリメント(東京都多摩市)は5月21日、顔を含む画像を送ると、顔や目、鼻などの位置を認識して座標データを送り返す顔認識APIを提供するサイト「detectFace();」を公開した。APIの提供は無料で、商用利用もできる。 顔、目、鼻、口、眉の位置と輪郭を認識し、その座標データをXML形式で送り返すWeb API。各パーツの輪郭情報まで提供するため、凝ったアプリケーションを構築できるという。 同APIを使ったサンプルサービスとして、画像をアップロードすると、画像中の人間の顔がパンダのイラストに変わる「ぱんだら」も公開している。 「価格はまちまちだが、顔認識エンジンの価格は安くても100万円以上。高い場合には1000万円以上するものもある」ため、個人のアプリ開発者は顔認識エンジンを使ったWebアプリが作りにくかったという。「今まで高価で手が出せなかったデベロッパーやWe

    顔認識APIを無料公開 商用利用もOK
  • 本物と見違えるような画像補間を実現するパスフレームワーク手法 - A Successful Failure

    SIGGRAPH2009で発表された"Moving Gradients: A Path-Based Method for Plausible Image Interpolation"という論文*1では、2枚の連続する入力画像を与えると、その間のフレームを極めて自然に補間生成する新たな手法を提案している。 図1 図1は両端の入力画像A, Bから間の3フレームを生成した例を示している。生成する補間フレーム数は任意で何枚でも生成可能であり、極めて自然な補間が実現できている。この例の驚くべきところは、制約条件を有する複雑で柔らかな局所変形を含む自然な補間画像が、全自動で生成されている点である。モーフィング処理では対応点を一点一点指定する必要があるが、ここで必要なのは2つの画像を選択するだけだ。 生成される補間画像の品質は素晴らしく、またアイデアもシンプルで興味深いので、原論文を参照して手法の概要

    本物と見違えるような画像補間を実現するパスフレームワーク手法 - A Successful Failure
  • Photoshopを凌駕するリアルタイムの動画像切り貼り処理 - A Successful Failure

    Photoshop等の画像編集アプリケーションを用いた画像処理において、パッチツールを用いた画像の切り貼りは重要な操作である。パッチツールを用いた切り貼り操作では、貼り付けたパッチ画像は周囲にあわせて自動的に調整され、境界面が目立たないようになる。SIGGRAPH2009において、ヘブライ大学の研究グループが、この切り貼り操作を高速で行う手法を提案している。動画に対してもリアルタイムに切り貼り操作を行う事ができる。まずは動画をご覧頂くのが良いだろう。 エントリでは論文*1を参照して、手法の紹介を行う。例によって図表は論文の引用である。 【告知】@LunarModule7でつぶやいています。 興味のあるかたはフォローください。 Mean-Value Seamless Cloning (a) Source patch(b) Laplace membrane(c) Mean-value me

    Photoshopを凌駕するリアルタイムの動画像切り貼り処理 - A Successful Failure
  • 物体認識のための局所特徴量 SIFTと最近のアプローチ

    物体認識のための局所特徴量 SIFTと最近のアプローチ http://www.vision.cs.chubu.ac.jp/SIFT/ 藤吉 弘亘 中部大学工学部情報工学科 概要 1. SIFT(Scale-Invariant Feature Transform) 2. SIFTアプローチの高精度化 - PCA-SIFT - GLOH(Gradient Location and Orientation) 3. SIFTアプローチの高速化 - SURF(Speeded Up Robust Features) 4. 学習を用いた高速化 - Randomized Trees 5. SIFTと一般物体認識(画像分類) 1. SIFT(Scale-Invariant Feature Transform) ステレオ画像 Related Work 回転・スケール変化 照明変化等に頑健 特徴点検出 スケー

  • 荒い写真の空白を埋める数学の魔法「compressed sensing」!(動画あり)

    荒い写真の空白を埋める数学の魔法「compressed sensing」!(動画あり)2010.03.08 23:005,514 satomi 「もっとズームしてくれ...そうそこだ...そいつの顔をもっとエンハンスしてくれないか...」と頼むと技師がカチャカチャやって容疑者Aの顔がクッキリ―というドラマでお馴染みのシーンが現実に! これを可能にしたのはスタンフォード大学エマニュエル・キャンデス(Emmanuel Candes)教授とUCLAテレンス・タオ(Terence Tao)教授が開発した「compressed sensing(CS)」という技法です。 映画のフェイクUIとは別物。このオバマの写真みたいに、低画素のざらざらなイメージ(左)も高画素のきれいなイメージ(右)に加工できるんですよ。 主に研究目的で開発されたもので、例えばMRIスキャンもデータを丸々じゃなく、少量だけスキャン

    荒い写真の空白を埋める数学の魔法「compressed sensing」!(動画あり)
  • Visual Wordsを用いた類似画像検索 - 人工知能に関する断創録

    類似画像検索システムを作ろう(2009/10/3) 3日で作る高速特定物体認識システム(2009/10/18) に続くOpenCVプロジェクト第三弾です。今回は、上の二つをふまえてカラーヒストグラムではなく、局所特徴量(SIFTやSURF)を用いた類似画像検索を試してみます。局所特徴量はグレースケール画像から抽出するため、カラーヒストグラムと違って色は見ていません。画像の模様(テクスチャ)で類似性を判定します。 実験環境は、Windows 7、MinGW C++コンパイラ、OpenCV2.0、Python 2.5です。EclipseでMinGWを使う方法はEclipseでOpenCV(2009/10/16)を参照してください。Visual C++にはないディレクトリスキャン関数を一部使っているのでVisual C++を使う場合は、少しだけ修正が必要です。 Bag-of-Visual Wor

    Visual Wordsを用いた類似画像検索 - 人工知能に関する断創録
  • 小さな画像を美しく拡大する「SmillaEnlarger」 - SourceForge.JP Magazine : オープンソースの話題満載

    デジカメ写真などの画像ファイルを拡大したいときは画像編集ソフトを使うのが一般的だ。しかし、通常のソフトで解像度が低い画像を無理やり拡大すると、まるでドット絵のような輪郭がギザギザの画像になったり、ノイズが目だったりして画質が大きく低下してしまう。そこで利用したいのが今回紹介する「SmillaEnlarger」である。 SmillaEnlargerは画像拡大専用に作られたツールだ。画像の拡大時に輪郭などのデータを自動で解析・補完して、とてもなめらかに美しく拡大してくれる。処理には独自のアルゴリズムを用いており、拡大後の画質は広く高画質として知られているバイキュービック法をしのぐ(図1、2)。 読み込みに対応している画像の形式はBMP/JPEG/PNG/PPM/TIFF/GIFの6種類。この内GIFを除く5種類での出力に対応しており、拡大しながら形式変換を行える。切り抜き機能もあるので、必要な

    小さな画像を美しく拡大する「SmillaEnlarger」 - SourceForge.JP Magazine : オープンソースの話題満載
  • 今日からはじめる「プロ並み写真プリント」

    グレーバランスに優れる顔料プリンターと良質な用紙を手に入れる。「第2の撮影」と言われる「プリント」が俄然楽しくなる。 画を触りましょう(レタッチしましょう) フイルム(ケミカルプロセス)と違って、画像処理を行えることがデジタルの最大の魅力。ゆえにデジタルの画は基的に「無難にまとめられています」。つまりストレートにプリントすると何だかポヤっとしてるような、メリハリがないような。そこで画を触って最適化します(レタッチ)。プリントが見ちがえります。 まずは「ヌケ・コク・キレ」だけで OK プロフェッショナルの世界ではレタッチを専門にする人(通称 ?:画処理)がいるほど突き詰めれば深〜いのですが、ここでは"なんちゃって"な方法をご紹介。たとえば「ヌケ・コク・キレ」。この意味を理解するだけでプリントが別物に。そしてレタッチの基中の基が身につきます。 それっぽいレタッチもご紹介 面倒なレタッチ作

  • 画像処理だけで三次元スキャナ作ってみた

    こんにちはmtdです.今回はカメラとパソコンさえあれば自動で処理してくれる「お手軽三次元スキャナ(試作品)」を作ってみました.前途多難かと思ってたんだけど案外悪くない結果になったので動画にしてみました.角度だけ測定しながら写真を撮るだけで,あとは面貼りまで自動です.写真測量というよりも,モデラーキラーなツールになればと思ってます.mylist/16965856 BGMは「タチコマの家出」 twitter:nc30mtd

    画像処理だけで三次元スキャナ作ってみた
  • 写真に基づく3D空間構築手法の到達点 - A Successful Failure

    一昔前は実世界の建築物を元にウォークスルー可能な3D空間を構築しようと思ったら、まず各部屋の形状を計測器を用いて計測し、その計測結果に基づいて人手でモデル化し、領域ごとにテクスチャを貼り、照明を設定して……と気の遠くなるような作業が必要だった。3D空間の構築は極めてコストの高い作業だったが、近年では2次元画像(実写写真)に基づいた3D空間の構築手法が長足の進歩を遂げており、以前に比べれば極めて低コストに3D空間を構築する事が可能となっている。 【告知】Twitterはじめました。@LunarModule7です。 興味のあるかたはフォローくださいとしばらく宣伝。 今ではバラバラに撮影した写真から、全自動で3D空間を構築し、内部を自由にウォークスルーできるようになっている。ワシントン大学とMicrosoft Reseachが2009年に発表した研究*1は現時点における集大成とも言えるものとなっ

    写真に基づく3D空間構築手法の到達点 - A Successful Failure
  • 3日で作る高速特定物体認識システム (7) 最近傍探索の高速化 - 人工知能に関する断創録

    3日で作る高速特定物体認識システム (6) 線形探索を用いた特定物体認識(2009/11/22)のつづきです。今回がこのシリーズの最終回です。 前回の線形探索は遅すぎるので最近傍探索を高速化します。これで表題の高速特定物体認識システムができあがります。高速化にはいくつかの方法がありますが、物体モデルデータベースをなんらかのデータ構造にあらかじめ格納しておくというのがポイントです。今回は、資料でも述べられているkd-treeとLocality Sensitive Hashing (LSH)という手法を試してみます。kd-treeは木構造、LSHはハッシュでデータを構造化(インデキシング)します。kd-treeは、厳密な最近傍を求めますが、LSHは近似最近傍検索と呼ばれ、厳密な最近傍は求められない代わりに計算を大幅に高速化できます。 資料では、ANN (Approximate Nearest

    3日で作る高速特定物体認識システム (7) 最近傍探索の高速化 - 人工知能に関する断創録
  • 「CELL REGZA」詳細仕様。新LED/超解像搭載の最上位TV

  • 何度見ても信じられない! 落書きから写真を合成!? PhotoSketch(動画あり)

    何度見ても信じられない! 落書きから写真を合成!? PhotoSketch(動画あり)2009.10.06 19:005,076 ネットの画像シーンに激震が走ろうとしています。 「PhotoSketch」はウェブベースの写真検索合成ツール。 いや、そんな言葉じゃ片付けられません。とにかくこの動画を見てください。 使い方はこんな感じ。まず、簡単にラフなスケッチを描きます。そして、それぞれのアイテムにラベル付けをします。上の図だと、「ボート」とか「結婚式のキス」とかですね。 そうとすると...! なんと! ネットからそれに合うイメージを検索、合成してくれるんです! いや何度見ても信じられませんよ。自分で描いた適当なラフ画を元に、どの写真が一番マッチするか選び出し、人、鳥、背景等、それぞれ違う写真からもってきたオブジェクトをうまいこと周りの背景に馴染ませて1枚の写真を作っています。 もちろん完璧

    何度見ても信じられない! 落書きから写真を合成!? PhotoSketch(動画あり)
  • 画像処理でボコーダーエフェクト - Radium Software

    Photosounder は,いわゆるスペクトル編集ツールと呼ばれる類のソフトウェアだ。音声データを周波数スペクトルに変換したり,逆にスペクトルを音声に戻したりすることができる。 スペクトル編集ツールを使うと,波形の直接編集では難しい類の加工を,直感的かつ視覚的に行うことが可能になる。上のビデオなどはその極端な例で, Photosounder と Photoshop を使ってボコーダーエフェクトを実現している。 ボコーダーエフェクトの原理はそれほど複雑なものではないけれど,口で説明するのはなかなかやっかいだ。でも,このビデオで行っていることを見ると,多少なりとも直感的に理解することができるかもしれない。音声(モジュレーター信号)と楽器音(キャリアー信号)をスペクトル画像に変換したあと,それを Photoshop のレイヤーに貼付けて,「乗算」で合成する。それだけの作業で,いわゆる「ロボット

    画像処理でボコーダーエフェクト - Radium Software