タグ

画像処理に関するnaoeのブックマーク (18)

  • フーリエ変換と画像圧縮の仕組み

    第2回 プログラマのための数学勉強会で発表した資料です http://maths4pg.connpass.com/event/11781/Read less

    フーリエ変換と画像圧縮の仕組み
  • 画像認識技術を使ったゲームの取り組み【CEDEC 2011】 - ファミ通.com

    2011年9月6日〜8日の3日間、神奈川県のパシフィコ横浜・国際会議センターにて、ゲーム開発者の技術交流などを目的としたCEDEC(コンピュータエンターテインメントデベロッパーズカンファレンス) 2011が開催されている。 稿では、開催初日にセッションひとつとして行われた“画像認識技術の使い方と最新の取り組み”についてリポートしていこう。昨今のゲームでは、顔認識技術を使ってプレイヤーの動きをリアルタイムで感知して、ゲームに反映する技術が使われているものがある。『グランツーリスモ5』で使われた“フェイストラッキング”もそのひとつ。このフェイストラッキングとは、プレイステーション3のUSBカメラ“PlayStation Eye”を利用した機能で、同カメラに顔を認識させた状態でレース中にプレイヤーが顔を左右に動かすと、ドライビング中の視点も連動して左右に動くというもの。セッションの後半では、

  • YouTube人気急上昇

    【マイクラ】ロボットがペットになった結果?【2022クラフト#28】【ゆっくり実況】【マインクラフト】【まいくら】

    YouTube人気急上昇
  • 画像処理におけるアルゴリズム

    ここでは各画像処理におけるアルゴリズムを簡単に解説する。 2値化 明るさ調整 色成分の抽出 色反転 コントラスト調整 切り出し ガンマ補正 グレイスケール化 増色 画像枠付加 鏡像反転 ノイズ除去 輪郭抽出 輪郭追跡 拡大縮小 任意角回転 セピア調化 ぼかし 2値化 指定画像を白と黒の2階調の画像に変換する処理であり、研究で作成した2値化処理は単一手動閾値方式、P-タイル法、また、誤差分散法およびその拡張型である Floyd&Steinberg 型誤差分散、Jarvice,Judice&Ninke 型誤差分散の5つである。 次にそれぞれのアルゴリズムについて解説する。 単一手動閾値方式 指定された色深度を基準として、その値より入力画素の色深度値が明るければ白、暗ければ黒色として2値化する。下の式を用いている。 このとき、出力画像は初期状態で黒色となるので、入力画像の画素値が閾値以

  • ゆーすけべー日記

    サキとは彼女の自宅近く、湘南台駅前のスーパーマーケットで待ち合わせをした。彼女は自転車で後から追いつくと言い、僕は大きなコインパーキングへ車を停めた。煙草を一吸ってからスーパーマーケットへ向かうと、ひっきりなしに主婦的な女性かおばあちゃんが入り口を出たり入ったりしていた。時刻は午後5時になる。時計から目を上げると、待たせちゃったわねと大して悪びれてない様子でサキが手ぶらでやってきた。 お礼に料理を作るとはいえ、サキの家には材が十分足りていないらしく、こうしてスーパーマーケットに寄ることになった。サキは野菜コーナーから精肉コーナーまで、まるで優秀なカーナビに導かれるように無駄なく点検していった。欲しい材があると、2秒間程度それらを凝視し、一度手に取ったじゃがいもやら豚肉やらを迷うことなく僕が持っているカゴに放り込んだ。最後にアルコール飲料が冷やされている棚の前へ行くと、私が飲むからとチ

    ゆーすけべー日記
  • リスクを取ることによる後悔の最小化問題 - 武蔵野日記

    お昼、そういえば今日はなにやら忙しいような気がしていたのだけど、と思っていたら、午後イチで副指導教員になっている人たちの中間発表があるんだった。むむ。 中間発表のあと、意味談話解析勉強会。今日は@jhirwin くんが Aria Haghighi and Dan Klein. Coreference resolution in a modular, entity-centered model. HLT/NAACL-2010. を紹介してくれる。先週@Wildkatzeくんが紹介してくれた共参照解析(文書中に出てくる「オバマ大統領」と「現大統領」が同じ実体を指すかどうか当てる問題)に関する論文 Raghunathan, Karthik and Lee, Heeyoung and Rangarajan, Sudarshan and Chambers, Nate and Surdeanu, Mi

    リスクを取ることによる後悔の最小化問題 - 武蔵野日記
  • 1年で70億枚の顔写真をスキャンしたFace.comが顔認識APIを無料で一般公開

    Indian startup Zypp Electric plans to use fresh investment from Japanese oil and energy conglomerate ENEOS to take its EV rental service into Southeast Asia early next year, TechCrunch has…

    1年で70億枚の顔写真をスキャンしたFace.comが顔認識APIを無料で一般公開
  • GazoPa Bloom - 4403 is written(終了しました)

    @自宅(個人の見解に基づいており,所属組織などとは一切関係ありませんし,事実かどうかもわかりません) この世界に希望をもつためには批判し続けることこそが必要だ - Edward W. Said (1935-2003) 超絶速報!類似画像検索で有名なGazoPaが「この花なに?」検索を可能にするGazoPa Bloomを開始した. GazoPa Bloom is a flower community site that enables users to search, discover and share flower information. GazoPa's similar image search technology is integrated in this site, and users can search for flowers by uploading flower pho

  • Visual Wordsを用いた類似画像検索 - 人工知能に関する断創録

    類似画像検索システムを作ろう(2009/10/3) 3日で作る高速特定物体認識システム(2009/10/18) に続くOpenCVプロジェクト第三弾です。今回は、上の二つをふまえてカラーヒストグラムではなく、局所特徴量(SIFTやSURF)を用いた類似画像検索を試してみます。局所特徴量はグレースケール画像から抽出するため、カラーヒストグラムと違って色は見ていません。画像の模様(テクスチャ)で類似性を判定します。 実験環境は、Windows 7、MinGW C++コンパイラ、OpenCV2.0、Python 2.5です。EclipseでMinGWを使う方法はEclipseでOpenCV(2009/10/16)を参照してください。Visual C++にはないディレクトリスキャン関数を一部使っているのでVisual C++を使う場合は、少しだけ修正が必要です。 Bag-of-Visual Wor

    Visual Wordsを用いた類似画像検索 - 人工知能に関する断創録
  • RGB⇔YCbCr変換 - koujinz blog

    リンク ・画像の変換(目次ページ) YCbCr関連 ・画像フォーマットの「RGB⇔YCbCr変換」 久しぶりに画像ネタを 世の中には RGB だとか、YCbCr だとかという色空間があって、 その相互変換について。 変換式については ITU-T BT.601 や BT.709 という規格書で定義されています。 (色空間については、これ以外にも規格があります。) 正確には、画像フォーマットの YCbCr ではなく、ビデオ信号の YCbCr の話です。 D端子ケーブルとか、Composite(NTSC)ケーブルとかを流れるデータ信号の事です。 その Bt.601には次のように書かれています。 ITU-R BT.609

    RGB⇔YCbCr変換 - koujinz blog
  • 3日で作る高速特定物体認識システム (2) SIFT特徴量の抽出 - 人工知能に関する断創録

    3日で作る高速特定物体認識システム (1) 物体認識とは(2009/10/18)の続きです。 今回は、画像からSIFT (Scale-Invariant Feature Transform) という局所特徴量を抽出するところを作ってみようと思います。 SIFT特徴量の抽出 まずは、局所特徴量の代表ともいえるSIFTを試してみます。OpenCVにはSIFTを抽出する関数がなかったのでRob Hess氏がC言語で実装したライブラリを試してみます。内部でOpenCVを使っているので事前にOpenCVのインストールが必要です。実装はOpenCV 1.1でされているみたいですが、2.0でもちょっと手直しすると動きました。Rob Hess氏のホームページからSIFT Feature Detectorのzip版を落とします。 (注)Hess氏のサイトが更新されたようで現在はGitHub上のOpenSIF

    3日で作る高速特定物体認識システム (2) SIFT特徴量の抽出 - 人工知能に関する断創録
  • 3日で作る高速特定物体認識システム (1) 物体認識とは - 人工知能に関する断創録

    情報処理学会の学会誌『情報処理』の2008年9月号(Vol.49, No.9)に「3日で作る高速特定物体認識システム」という特集記事があります。OpenCVを用いた面白そうなプロジェクトなのでレポートにまとめてみようと思います。3日でできるかはわからないけど。 残念ながらこの記事はPDFを無料でダウンロードすることができません(CiNiiでオープンアクセス可能になったみたいです)。なので会員以外で元記事が読みたい人は図書館でコピーする必要があるかも・・・また、2009年9月号の人工知能学会誌にも物体認識の解説「セマンティックギャップを超えて―画像・映像の内容理解に向けてー」があります。こちらも非常に参考になりますが同様にPDFが手に入りません・・・。他にもいくつかわかりやすい総説論文へのリンクを参考文献にあげておきます。 物体認識とは 物体認識(object recognition)は、画

    3日で作る高速特定物体認識システム (1) 物体認識とは - 人工知能に関する断創録
  • 類似画像検索システムを作ろう - 人工知能に関する断創録

    C++版のOpenCVを使ってカラーヒストグラムを用いた類似画像検索を実験してみました。バッチ処理などのスクリプトはPythonを使ってますが、PerlでもRubyでも似たような感じでできます。 指定した画像と類似した画像を検索するシステムは類似画像検索システムと言います。GoogleYahoo!のイメージ検索は、クエリにキーワードを入れてキーワードに関連した画像を検索しますが、類似画像検索ではクエリに画像を与えるのが特徴的です。この分野は、Content-Based Image Retrieval (CBIR)と呼ばれており、最新のサーベイ論文(Datta,2008)を読むと1990年代前半とけっこう昔から研究されてます。 最新の手法では、色、形状、テクスチャ、特徴点などさまざまな特徴量を用いて類似度を判定するそうですが、今回は、もっとも簡単な「色」を用いた類似画像検索を実験してみます

    類似画像検索システムを作ろう - 人工知能に関する断創録
  • 画像処理でボコーダーエフェクト - Radium Software

    Photosounder は,いわゆるスペクトル編集ツールと呼ばれる類のソフトウェアだ。音声データを周波数スペクトルに変換したり,逆にスペクトルを音声に戻したりすることができる。 スペクトル編集ツールを使うと,波形の直接編集では難しい類の加工を,直感的かつ視覚的に行うことが可能になる。上のビデオなどはその極端な例で, Photosounder と Photoshop を使ってボコーダーエフェクトを実現している。 ボコーダーエフェクトの原理はそれほど複雑なものではないけれど,口で説明するのはなかなかやっかいだ。でも,このビデオで行っていることを見ると,多少なりとも直感的に理解することができるかもしれない。音声(モジュレーター信号)と楽器音(キャリアー信号)をスペクトル画像に変換したあと,それを Photoshop のレイヤーに貼付けて,「乗算」で合成する。それだけの作業で,いわゆる「ロボット

    画像処理でボコーダーエフェクト - Radium Software
  • Many steps needed for some color-space conversions

  • JPEG、GIF、PNG画像選択の指針まとめ | エンタープライズ | マイコミジャーナル

    SitePoint: New Articles, Fresh Thinking for Web Developers and Designers Jennifer Farley氏がSitePointにおいてGIF, PNG, JPG. Which One To Use?のタイトルのもと、Webサイトを作成するにあたってどの画像フォーマットを採用すべきかという指針を簡単にまとめている。まず氏はそれぞれの画像フォーマットの特徴を簡単に説明。 GIF - 256色のインデックス画像。写真には向かないが、ロゴであったりフラットブロックな画像には向いている。透過データを保持できるという特徴がある JPEG - クオリティによって圧縮率が変わる非可逆圧縮の画像フォーマット。透過は表現できないが、写真データの用途に向いている PNG - GIFに似ているが、GIFのようなぎざぎざを出さずに背景透過を実現

  • Seam Carving for Content-Aware Image Resizing

    Seam carving is an image resizing algorithm developed by Shai Avidan and Ariel Shamir. This algorithm alters the dimensions of an image not by scaling or cropping, but rather by intelligently removing pixels from (or adding pixels to) the image that carry little importance.The importance of a pixel is generally measured by its contrast when compared with its neighbor pixels, but other measures may

  • Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure

    画像内に映り込んだ所望のオブジェクトを排除し、違和感の無い画像を生成するシーン補完技術に関しては近年複数の研究成果が発表されている。しかし中でも2007年のSIGGRAPHにて米カーネギメロン大のJames HaysとAlexei A. Efrosが発表した手法*1はブレークスルーとなりうる画期的なものだ。 論より証拠、早速適用例を見てみよう。エントリで利用する画像はPresentationからの引用である。元画像の中から邪魔なオブジェクト等の隠蔽すべき領域を指定すると、その領域が補完された画像が自動的に生成される。 アルゴリズム 効果は抜群だがアイデア自体は単純なものだ。Web上には莫大な数量の画像がアップされており、今や対象となる画像の類似画像を一瞬にして大量に検索することができる。そこで、検索された類似画像で隠蔽領域を完全に置き換えてしまうことで違和感の無い補完画像を生成するのだ。

    Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure
  • 1