タグ

画像処理に関するyowaのブックマーク (35)

  • ゆゆ式を無限に楽しみたかった話 〜 ゆゆ式 Advent Calendar 2014 20日目 〜 - しゅみは人間の分析です

    ある日のこと、後輩たちがこんなことを言いました。 「ゆゆ式のコマをランダムに並びかえたら無限にゆゆ式が楽しめるのでは?」 真面目に計算してみると、10の15乗くらいの組み合わせができることがわかりました。 この記事ゆゆ式アドベントカレンダー20日目は、そんな無限にゆゆ式をたのしむためのシステムを真面目に作ってみた話をします。 コマの切り出し 漫画のコマを並び替えるためには、コマがバラバラな画像として存在していなければなりません。 なので、まずは自炊で電子化された書籍をコマの線にそって切り出していく処理を自動化することにしました。 上の図がふつうの4コマの1ページですね。これの枠線を識別して、1ページから8枚のコマを取り出してくる方法を考えます。 ハフ変換で直線検出 OpenCVという画像処理のライブラリに直線を検出するツールがあったので、まずこれを試してみました。 が、結果はこのとおり。

    ゆゆ式を無限に楽しみたかった話 〜 ゆゆ式 Advent Calendar 2014 20日目 〜 - しゅみは人間の分析です
  • Color Constancy のアルゴリズム (第2回)

    さて,前回に引き続きましてColor Constancyのアルゴリズムです.前回の記事はこちらからどうぞ. Color Constancy のアルゴリズム (第1回) 今回は後半の3つのアルゴリズム, Rahmanのアルゴリズム 準同型フィルタを用いたアルゴリズム Faugerasのアルゴリズム を紹介したいと思います.それでは,レッツスタート! Rahmanのアルゴリズム RahmanのアルゴリズムはMooreのアルゴリズムとほぼ同等の仮定に基づいています.Mooreのアルゴリズムでは光源色が一定と考えられる範囲がガウシアンフィルタのσによってきめられていましたが,Rahmanのアルゴリズムは異なるσでMooreのアルゴリズムを実行し,その結果を重みつき平均することでより良い結果を作っています. 入力画像01 出力画像01 入力画像02 出力画像02 おそらくここで紹介している6つのアル

    Color Constancy のアルゴリズム (第2回)
  • 【連載】コンピュータビジョンのセカイ - 今そこにあるミライ

    皆様はコンピュータビジョンという用語をご存知でしょうか。例えばデジタルカメラに搭載されている顔画像認識や、Google Street Viewの360度パノラマ表示、XBox360のKinectによるプレイヤーのジェスチャー認識など、これらは全てコンピュータビジョンの技術による製品です。

    【連載】コンピュータビジョンのセカイ - 今そこにあるミライ
  • Using large-scale brain simulations for machine learning and A.I.

    Using large-scale brain simulations for machine learning and A.I.
    yowa
    yowa 2014/09/19
    「deep learning で猫画像」の元記事(?)
  • Graph Cut Image Segmentation

    Graph Cut Image Segmentation 概要: 非常に有名な画像領域分割手法.代表的な2通りの使い方がある. 1)バイナリラべリング(前景/背景ラべリング). ユーザ(または自動アルゴリズム)が,前景領域内部と背景領域に複数のSeedを指定すると,「指定された前景/背景Seedに似た色を持つ画素が前景/背景になるよう」,「隣接画素の色の差が大きい部分にラベル境界が来るよう」,最適なラべリングが計算される. 2) 複数領域ラべリング.  抽出したい領域の複数の代表画素を,ラベル毎に指定しておくと,「あるラベルの代表画素値と似た色の画素はそのラベルに属すよう」「隣接画素の色の差が大きい部分にラベル境界が来るよう」各画素をラべリングする. この手法の最大の特徴は,上記の要求を満たすエネルギー関数をうまく定義し,その最小化解が最大フロー(最小カット)問題を解くことで得られる事を利

  • Hello Autoencoder — KiyuHub

    Hello Autoencoder 最近,身内でDeep Learningを題材に含んだ勉強会を行なっている. メインは専門である自然言語処理まわりだが, とりあえず実装(というよりnumpy)の導入になる上,結果を視覚化できることから, 画像データを利用したAutoencoderの実装について取り扱った. 軽い説明と共にコードと,色々な結果を Autoencoder Autoencoderとは,Neural Networkの特殊系で,基的には 入力層と出力層のユニット数が同じである. 教師信号として入力そのものを与える. という特徴を持つ. 入力と出力が共に4次元で,隠れ層が2次元なAutoencoderの図 Autoencoderは,入力の情報をを一度隠れ層の空間に写像(encode) したあと, 元の信号を復元(decode)するようなパラメータを学習する. 図のように,もしも隠れ

  • Caffeで手軽に画像分類

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。システム統括部 データソリューション部の宮崎です。 最近ディープラーニングと呼ばれる技術の話題を耳にすることが増えてきました。 この記事ではディープラーニングの手法を実装し画像認識系の用途で便利に使えるCaffeというツールの使い方を紹介します。 Caffeの概要 Caffeは、C++で実装されGPUに対応した高速なディープラーニングのライブラリです。 大規模画像認識のコンテストILSVRCで2012年にトップとなった畳込みニューラルネットワークの画像分類モデル[1]がすぐに利用できるようになっています。 Caffeは、カリフォルニア大学バークレー校のコンピュータビジョンおよび機械学習に関する研究センターであるBV

    Caffeで手軽に画像分類
  • 佐村河内問題へのコンピュータビジョン的アプローチ | ぱろすけのメモ帳

    序論 近年、全聾の作曲家とされた佐村河内守氏がゴーストライターを用いていたことを告白し、同時に障害者手帳の不正受給も疑われ、大きな問題となっている。その報道の中で、佐村河内氏の容姿が多くの著名人と酷似していること、2月の会見と3月の会見で外見が大きく変化したことが話題となった。 具体的には、2月の会見の時点で話題になったものが 笑 佐村河内を探せ!(勝手に改訂版) pic.twitter.com/3TLFm14PvZ” — FACT (@factjapan) February 7, 2014 であり、3月の会見を踏まえて修正されたものが 佐村河内を探せの最新版クソワロタ pic.twitter.com/ptNhxecCW4 — 天才指揮者bot (@Siegfried_Idyll) March 7, 2014 である。 ここで興味深いのは、佐村河内氏の顔をコンピュータに学習させ、これらの顔

    佐村河内問題へのコンピュータビジョン的アプローチ | ぱろすけのメモ帳
  • LINEカメラのプリクラ加工とPrimoのプリクラ打ち消しを対決させてみた!

    どうも、あさやんです。 みなさんLINEカメラは使っていますか? スマホ界の巨人、LINEが送り出す写真加工アプリですが、 いつのまにやらビューティー機能という、 プリクラ系のすごい機能が搭載されていました。 この機能のすごいところは何と言っても自動でプリクラ風加工ができるとこ。 よくあるプリクラ風加工アプリは 目の位置を自分で選んだり、輪郭をなぞったりと、 手動で加工しないといけないものが主流ですが、 ビューティー機能はそういう手間一切なしの便利自動機能となっています。 いやーすごいですね。 すごい。すごいですよ。 ですけども。 その加工力はどれぐらいのもんや、と。 やっぱり人間は好奇心の塊ですからね。 確かめたくなります。 それを確かめるために、 今回はこのLINEカメラにとあるアプリと殴りあってもらおうと思います。 そのとあるアプリとはPrimo。 前回その凄まじさをご紹介しましたが

    LINEカメラのプリクラ加工とPrimoのプリクラ打ち消しを対決させてみた!
  • 写真を絵のように見せる写真加工技術「PhotoDramatica」トップ - あやえも研究所

    (公開日:2010年10月) 「綺麗な背景画像を簡単に作りたい!」 そんな思いから、この写真加工技術「PhotoDramatica(フォト・ドラマティカ)」は生まれました。 この技術は、以下のような特徴があります。

  • 大神 絶景版(HDリマスター)~絶景の舞台裏~ Behind the Okami HD: ヘキサドライブ日記

    こんにちは、ブログではご無沙汰しています。イワサキです。 今日は、『大神 絶景版 (Okami HD)』の発売日ということで大神にまつわる内容で SD作品のHD化移植に関する技術的な話題をお話してみようと思います。 「大神」はPlayStation2で2006年4月20日に発売された作品ということで、 その6年後の今、絶景版として再び蘇ったことになります。 PS2版当時はSD解像度でしたので480iの表示でのレンダリング解像度でした。 今回ヘキサドライブでHD化移植担当させていただく際に、 ”PS2版のビジュアルの表現そのものを移植する”という大きな目標の他に、ヘキサドライブ社内では”HD解像度の魅力と恩恵を最大限に引き出す”という目標を持って取り組んできました。 当初720p(1280x720)での移植の想定でプロジェクトがスタートしました。 実際開発途中の段階では720pでレンダリング

  • 「Seene」革命的で超楽しい!! これからカメラは "動かして撮る、見るときも動かす" 新時代へ:DDN JAPAN

    DDN は 音楽 ・ 映像 に関する デジタル アート を中心に情報ミックスを配信中

    「Seene」革命的で超楽しい!! これからカメラは "動かして撮る、見るときも動かす" 新時代へ:DDN JAPAN
  • 100×100倍 超解像ソフト

    ダウンロードはこちら ↓ SR100x100.zip (Windows用 Version 2015.03.23) 2014.9.26 JPEGノイズ除去機能搭載。 2015.3.23 画像ファイルのクリックによる起動に対応。 ノイズ除去をバックグランドにして高速化。 (※動画についてはこちらを参考にして下さい。 使い方 特別なインストールは不要です。 SR100x100.exe と SR.dic を同じフォルダに置いてください。 マウスとスクロールホイールだけの簡単操作です。 iPad と同じような感覚で操作してください。 例1 JPEG画像を4×4倍 ↓JPEG画像

  • 超解像 - koujinz blog

    リンク ・画像の変換(目次ページ) 『拡大・縮小』関連 ・画像の縮小 ・画像の拡大「Nearest Neighbor法」 ・画像の拡大「Bilinear法」 ・画像の拡大「Bicubic法」 ・画像の拡大「Lanczos法」 ・画像の拡大-距離計算に関する考察 ・超解像 東芝のホームページに REGZA に搭載している『超解像技術』 (レゾリューションプラスなど)の解説記事がありました。 ここや ここ。 「実に、おもしろい。」 「私もやってみよう!」 ある画像①を拡大し、拡大した画像②をもう一度縮小③すると、 オリジナルとの差分④が得られます。 『差分が出てしまうということは、 拡大時に落としてしまった情報成分があるのではないか?』 どうやら、そんな発想から来ているようです。 こういった考え方は MPEG Video エンコードのループバックに似ています。 『オリジナル画像①を拡大した②に

    超解像 - koujinz blog
  • MovieReshape: ビデオ内の人物のプロポーションを自在に操る - A Successful Failure

    2010年12月16日 MovieReshape: ビデオ内の人物のプロポーションを自在に操る Tweet 図1: MovieReshape いよいよSIGGRAPH Asia 2010が韓国で開催されるが、今年の発表の中で最も面白いものの一つがエントリで紹介するMovieReshapeだ*1。MovieReshapeは動画中に登場する人物のプロポーション(身長、体重、胸囲、ウェスト、足の長さ、筋肉量)を自在に変更できる手法であり、その効果は一目瞭然だ。手法としてはモーフィング可能な3Dモデルをビデオ内の人物に適合させ、3Dモデルのプロポーション変形に合わせてビデオを修正するというもので、変更自体はインタラクティブに行える。まずは動画を見てみるのが早いだろう。エントリでは論文を参照しつつ、MovieReshapeについて紹介したい。 背景 写真や動画におけるリタッチはもはや当たり前に行

  • G'MIC - GREYC's Magic Image Converter

    G'MIC has been made available as an easy-to-use plug-in for GIMP. It extends this retouching software capabilities by offering a large number of pre-defined image filters and effects. Of course, this plug-in is highly customizable and it is possible to dynamically add your custom G'MIC-written filters in it. Here you will find pre-compiled binaries of the plug-in for common architectures. Pick on

    yowa
    yowa 2010/07/24
    GREYCstoration の後継
  • GREYCstoration

    Open source algorithms for image denoising and interpolation. Image Team, GREYC Lab (UMR CNRS 6072) 6 Bd du Marechal Juin, 14050 Caen Cedex / France. The following examples illustrate how the algorithm can be used for image filtering, in order to denoise, simplify or create painting styles from color images. Click on an image thumbnail to enlarge it, and to see the original/filtered images. Some

  • 本物と見違えるような画像補間を実現するパスフレームワーク手法 - A Successful Failure

    SIGGRAPH2009で発表された"Moving Gradients: A Path-Based Method for Plausible Image Interpolation"という論文*1では、2枚の連続する入力画像を与えると、その間のフレームを極めて自然に補間生成する新たな手法を提案している。 図1 図1は両端の入力画像A, Bから間の3フレームを生成した例を示している。生成する補間フレーム数は任意で何枚でも生成可能であり、極めて自然な補間が実現できている。この例の驚くべきところは、制約条件を有する複雑で柔らかな局所変形を含む自然な補間画像が、全自動で生成されている点である。モーフィング処理では対応点を一点一点指定する必要があるが、ここで必要なのは2つの画像を選択するだけだ。 生成される補間画像の品質は素晴らしく、またアイデアもシンプルで興味深いので、原論文を参照して手法の概要

    本物と見違えるような画像補間を実現するパスフレームワーク手法 - A Successful Failure
  • Visual Wordsを用いた類似画像検索 - 人工知能に関する断創録

    類似画像検索システムを作ろう(2009/10/3) 3日で作る高速特定物体認識システム(2009/10/18) に続くOpenCVプロジェクト第三弾です。今回は、上の二つをふまえてカラーヒストグラムではなく、局所特徴量(SIFTやSURF)を用いた類似画像検索を試してみます。局所特徴量はグレースケール画像から抽出するため、カラーヒストグラムと違って色は見ていません。画像の模様(テクスチャ)で類似性を判定します。 実験環境は、Windows 7、MinGW C++コンパイラ、OpenCV2.0、Python 2.5です。EclipseでMinGWを使う方法はEclipseでOpenCV(2009/10/16)を参照してください。Visual C++にはないディレクトリスキャン関数を一部使っているのでVisual C++を使う場合は、少しだけ修正が必要です。 Bag-of-Visual Wor

    Visual Wordsを用いた類似画像検索 - 人工知能に関する断創録
  • Google Code Archive - Long-term storage for Google Code Project Hosting.

    Code Archive Skip to content Google About Google Privacy Terms

    yowa
    yowa 2010/01/29
    > NHocr is a command line OCR (Optical Character Recognition) program for Japanese language, etc.