タグ

CVに関するtotottiのブックマーク (18)

  • Tokyo police are taking 3D mugshots of suspects

    tototti
    tototti 2016/01/25
    ほー。
  • 論文『大規模 AV 画像データベースと類似顔画像検索を用いた AV 検索システム』を公開しました | ぱろすけのメモ帳

    By Robert McDon. 昨年に顔画像をもとに似た顔の人が出ている AV を検索するツールを公開しました。そのツールは大変好評を博し、いろんなところで話題になってなかなか嬉しかったのですが、今回はそれを論文にした件の報告です。 あの人の研究論文集というものがありまして、そこではネタ系の文章が学術論文の体裁をもって多数掲載されています。これは僕も投稿する他ないではないか、というわけで昨年の12月に投稿しました。すると査読を無事に通過し、昨年末発行の論文集に掲載されました。コミケで販売されたのですが、どうやら完売に近いらしく、確認を取ったところ Web で無料で公開しても良いとのことだったので、今回ここで論文を無料で公開します。 さてさて。 [ダウンロードはこちら。] タイトルは『大規模 AV 画像データベースと類似顔画像検索を用いた AV 検索システム』です。どのような背景を持って

    tototti
    tototti 2014/03/11
    高度に発達したコンピュータビジョンの研究は、このように実社会で活用されるわけですね...。
  • 佐村河内問題へのコンピュータビジョン的アプローチ | ぱろすけのメモ帳

    序論 近年、全聾の作曲家とされた佐村河内守氏がゴーストライターを用いていたことを告白し、同時に障害者手帳の不正受給も疑われ、大きな問題となっている。その報道の中で、佐村河内氏の容姿が多くの著名人と酷似していること、2月の会見と3月の会見で外見が大きく変化したことが話題となった。 具体的には、2月の会見の時点で話題になったものが 笑 佐村河内を探せ!(勝手に改訂版) pic.twitter.com/3TLFm14PvZ” — FACT (@factjapan) February 7, 2014 であり、3月の会見を踏まえて修正されたものが 佐村河内を探せの最新版クソワロタ pic.twitter.com/ptNhxecCW4 — 天才指揮者bot (@Siegfried_Idyll) March 7, 2014 である。 ここで興味深いのは、佐村河内氏の顔をコンピュータに学習させ、これらの顔

    佐村河内問題へのコンピュータビジョン的アプローチ | ぱろすけのメモ帳
    tototti
    tototti 2014/03/10
    ちゃんと論文を読んで作っちゃうところがすごい。
  • Googleの新プロジェクトがスゴすぎる、可能性はストリートビューの比ではない「Tango」が真に驚異である理由

    昨日、突然発表されたGoogleの新プロジェクト「Tango」の無限大の可能性に胸をときめかせたのは筆者だけだろうか。 Google、スマホに人間レベルの空間認識能力を与えるプロジェクト「Tango」を発表 個人的にはかなりインパクトのあるニュースだったが、それほど大きな話題にはなっていないようだ(少なくとも日国内では)。 Tangoが驚異的なプロジェクトになりうる理由を、Googleマップのストリートビューと比較しつつ、妄想を交えながら気楽に考えてみたい。 スマホで部屋を3Dモデル化した動画が公開 まず、TechCrunchが新たに公開した動画を見てみよう。 室内を撮影 雑然と物が置かれた部屋を、Tangoの試作スマホによって撮影していく。この試作機には、モーションセンサや奥行きを感知するDepthセンサ、カメラ、高性能プロセッサが搭載されている。 部屋内を移動しながら、ゆっくり撮影し

    Googleの新プロジェクトがスゴすぎる、可能性はストリートビューの比ではない「Tango」が真に驚異である理由
    tototti
    tototti 2014/02/24
    ほうほう。
  • アップル。3D専門家募集!技術者の方是非。: 最新情報が気になる人のアップル速報

    面白いニュース発見しました。 アップルが「コンピューター・ヴィジョンの専門家」を募集しているみたいですよ。 求人案内が「3D幾何学」「3D復元」「3D環境におけるカメラと平面」など、頻繁に「3D」に言及しているのが興味深い! Appleはかなり前から3D処理に関する特許をとっていたようです。 特に興味深い技術は、ユーザーの目の位置で調整される3Dディスプレイで、見る人の位置で動的に変化するドロップシャドウ(影効果)のような微妙な3D効果が得られる技術Appleは他にもメガネのいらない独自の3Dディスプレイでも特許を取得しています。 元記事ではこれらの技術iPhone,iPadにどう使われるか推測しているのですが、ARに使われるのでは?と書かれています。 セカイカメラで注目を集めましたが、イマイチ盛り上がらなかった印象が私にはあるのですが、期待はしているAR。 オシャレな人が着てる服が、

    アップル。3D専門家募集!技術者の方是非。: 最新情報が気になる人のアップル速報
    tototti
    tototti 2012/04/21
    CVの人募集とか。学資の頃、もっとちゃんと勉強しとけばよかったなー。
  • 【無料】複数の写真をクラウドにアップするだけで3Dモデルに変換「Autodesk 123D Catch」:DDN JAPAN

    DDN は 音楽 ・ 映像 に関する デジタル アート を中心に情報ミックスを配信中

    【無料】複数の写真をクラウドにアップするだけで3Dモデルに変換「Autodesk 123D Catch」:DDN JAPAN
    tototti
    tototti 2011/12/12
    そういえば、自分の研究室の先生がこういうことをやろうとしていたな・・・。というようなことを思い出したり。
  • Web上の膨大な写真からローマを1日で構築する方法 - A Successful Failure

    前回、『写真に基づく3D空間構築手法の到達点』としてバラバラの写真から3D空間を構築する手法について取り上げた。コメントで言及された人もおられたが、MicrosoftはPhotosynthとして、同様にStructure-from-Motion (SfM)を用いて写真をつなぎ合わせ、インタラクティブにブラウズできるPhotosynthを公開している。 Photosynth Overhead View on Vimeo Photosynth + Bing Maps on Vimeo 現在、研究レベルではWeb上にアップされた不特定多数のユーザによる膨大な写真から街一つを再現するプロジェクトが推進されている。その名も"Building Rome in a Day"(ローマを一日にして成す)だ。下の動画はFlickr検索された画像から生成された3Dモデルを示している。エントリでは、論文*1に基

    Web上の膨大な写真からローマを1日で構築する方法 - A Successful Failure
    tototti
    tototti 2011/11/10
    今日の勉強会で教えてもらった事例。flickrの画像から、ローマの街並みをモデリング。キャリブレーションしたカメラならともかく、flickrのテキトーな写真でパラメータ求めてるのがすごいと思う。
  • Zoff 「Zoff Mirror」 : 広告会議

    広告会議 雑感 (70) 日記 (55) ブログ日記 (46) リアル広告会議 (69) 月刊 広告会議 (58) 広告関連相関図 (7) みんなで広告会議 (9) WEBサイト会議 ニュース・情報系 (54) 雑誌・マガジン系 (79) 自動車・航空・鉄道 (142) 携帯電話 (111) 電化製品 (130) PC関連 (71) 通信 (34) 品・飲料 (239) ファッション (281) コスメ (109) 人材サービス (6) 建築・不動産 (24) 金融・カード (17) 音楽 (36) 映画 (31) ゲーム (27) 文房具 (11) 広告・マーケ (138) アワード (65) 動画共有 (34) 動画配信 (41) WEBサービス (174) オンラインツール (88) その他業界 (227) 海外サイト紹介 (73) 年間総集編 (5) ムービー会議 YouTube

    Zoff 「Zoff Mirror」 : 広告会議
    tototti
    tototti 2011/05/22
    Webカメラの映像にZoffのメガネを重ねて表示し、試着ができる。これ面白そう。
  • 多分こうすれば、Kinectの表情認識っぽいの作れる | fladdict

    Cesで発表された、Kinectによる表情認識のアバター技術。これ面白いなぁと思いつつ、ちょっと工夫すれば以外と普通のテクノロジーでいけるんじゃないかと。 いま時間がないので、自分で実装できないけどロジックのメモ。これを読んだ誰かに託します。そしてトラックバックをしてくださいwww Step1: OpenCVで顔を認識する とりあえずは定番のOpenCVで顔の矩形を認識します。 ここまでは普通普通。 Step2: 口を認識する で、認識した顔の矩形ビットマップの下半分を切り出して、それをソースに、口をOpenCVで認識します。 定義XMLは家CVにあるので問題無し。下半分を切り出すことで、目や眉毛を口と認識する問題を回避します。顔をソースに再帰することで、目と口が同じ顔に属することを保証します。 普通の人間は、顔の下50%に口がついていると思うので、口がおでこにある人を認識できなくてもい

    tototti
    tototti 2011/01/21
    ふむふむ。
  • 2次元が3次元に変身! 米スタンフォード大が画像3D化プログラムを公開 | ネット | マイコミジャーナル

    米スタンフォード大学の研究チームは、2Dの画像を自動解析し、3Dの立体映像へと作り変える新ソリューション「Make3D」を公開している。解析に用いるコンピュータ性能に限りがあるため、利用には一定の制限が設けられるものの、無料アカウントを作成して利用可能だ。 Make3Dで3Dグラフィック化したい画像を指定すると、写真を小さなパーツごとに分析する「Markov Random Field」(MRF)技術によって各パーツ間の位置関係を把握、立体的にとらえられる映像を生成する。Adobe Shockwave PlayerやVRMLビューアで自由に閲覧でき、将来的にはFlashムービーの自動作成機能の追加などがアナウンスされている。 MRF技術でのアルゴリズム解析は、学習機能によって精度アップが図られるため、現時点では未完成な部分も多いが、多彩な分野への応用も期待される。

    tototti
    tototti 2008/02/01
    この研究は定期的に成果が出てくる気がする。
  • 社長も「ぶったまげた」リアルさ 顔写真を3Dアニメ化する「MotionPortrait」

    「ぶったまげた。こんなにリアルに人の顔が動くなんて」――元ソニー木原研究所社長の藤田純一氏は「MotionPortrait」を初めて見たときの感想をこう語る。「技術者として驚いた。でも何に使えばいいんだろうね、とみんなで話し合った」 MotionPortraitは、1枚の顔写真から多彩な表情の3Dアニメーションを作り出す技術で、ソニー木原研で2年前に開発された。自動でまばたきさせたり、視線をそらしたり、くしゃみさせたりできるほか、マウスの動きに合わせて左右に顔を向けたりするなど、まるで生きているかのようにリアルに動く。 記者も顔写真を3D化してもらったが、そのリアルさに驚いた。音楽に合わせて首を縦に降ったり、眉が片方だけつり上がったり、鼻が上を向いたりと、自分の顔が激しく動き、自分ではないようだ。「人がやらないようなありえない表情を作ることもできて楽しいですよ」と藤田社長が言う通りだ。

    社長も「ぶったまげた」リアルさ 顔写真を3Dアニメ化する「MotionPortrait」
    tototti
    tototti 2007/07/24
    5年位前、MS北京研究所の研究でゲイツさんの顔をいじるのがあった。こっちは写真1枚からできるのが良いかな。
  • ビデオパノラマ(ビデオラマ)の作り方 (Photojojo � How to Make Video Panoramas from Your Digital Camera’s Video Clips)

    $10 off New Framed PrintsCapture your favorite snapshots in a beautiful frame with our brand new Framed Prints. Save $10 with the code FRAME through Monday, March 18th. Shop Framed Prints Hi! We’re Parabo PressWe share in your joy, celebrate your story and help you hold onto life’s moments with thoughtfully-designed photo prints. Shop Prints

    ビデオパノラマ(ビデオラマ)の作り方 (Photojojo � How to Make Video Panoramas from Your Digital Camera’s Video Clips)
    tototti
    tototti 2007/04/03
    なかなか面白い試み。
  • 顔写真1枚から3D画像を生成する技術を開発,顔写真ネット検索サービスに適用

    スウェーデンのPolar Roseは,1枚の顔写真から顔の3次元(3D)画像を生成する技術を開発した。Polar Rose創設者兼CTOのJan Erik Solem氏が現地時間12月19日,同社のブログへの投稿で明らかにしたもの。Polar Roseは同技術を,顔写真のインターネット検索サービスに適用する。 Solem氏によると,複数の顔写真が同一人物のものか確認しようとしても,写真によって光の当たり方や顔の向きが異なるため難しいという。Polar Roseは3D顔画像の生成ソフトウエアを利用することで,撮影条件の差異を排除し,検索精度を高める。 「(ソフトウエアで生成した)3D画像は推測しただけで,きちんと測って生成したものでないが,顔認識の精度を大幅に高められる」(Solem氏)。 米メディア(InfoWorld)によると,Polar Roseは2004年11月に設立した企業で,当初

    顔写真1枚から3D画像を生成する技術を開発,顔写真ネット検索サービスに適用
  • 米Intel、画像処理ライブラリ「OpenCV 1.0」を公開 | エンタープライズ | マイコミジャーナル

    米Intelは6日(米国時間)、オープンソースの画像処理用ライブラリ「OpenCV 1.0」を正式にリリースした。対応プラットフォームはWindowsのほか、LinuxMac OS XなどのPC UNIX。ソースコードにはBSDライセンスが適用され、自由な改変および再配布が許される。 今回公開されたOpenCV 1.0は、1999年のプロジェクト開始以来、はじめての安定版リリース。安定性が向上したほか、64ビット環境のWindows(Win64)のサポート改善、Pythonインタフェースの改良など、2005年7月リリースのベータ第5版に大幅な修正が加えられている。 Mac OS Xへの対応も強化され、他のPC UNIXではGTK+に依存する機能がCarbonに、FFMPEGに依存する機能がQuickTimeに置き換えられようになったほか、デフォルトの設定でユニバーサルバイナリが生成される

    tototti
    tototti 2006/11/10
    ComputerVision
  • 二次元を三次元に変換

    二次元を三次元にする技術、だそうです。 カーネギーメロン大学の研究者たちのこのすばらしい研究成果を、血圧を下げ、心を落ち着かせ、ゆったりとリラックスした気分にしてくれる音楽と共に、お楽しみください。 これは二次元の写真から幾何学的なパターンを解析して三次元にする技術だそうです。グラビアアイドルとかアニメとかに応用したらどうなるんでしょうね。ぜひ実験していただきたいと思います。 Carnegie Mellon Researchers Teach Computers To Perceive Three Dimensions in 2-D Images [Carnegie Mellon University] Thanks, Thomas!

    二次元を三次元に変換
    tototti
    tototti 2006/10/26
    イメージベースレンダリング。写真一枚+全自動っていうのがちょっとすごいかも。あと、結果の見せ方がうまい
  • DNP子会社、立体物画像認識システムでの携帯向けキャンペーンサイト構築を開始

    大日印刷(DNP)は8月31日、子会社のモバイルインパルスが、立体物の画像認識システムを使った携帯電話向けキャンペーンサイト構築サービスの試用版を同日から開始すると発表した。 立体物の画像認識システムは、ユーザーがカメラ付き携帯電話機で撮影した画像を指定のアドレスにメールで送信すると、画像データベースと照合し、関連するウェブサイトのURLを返信する。 商品などを撮影して送信するだけで、容易にキャンペーンサイトにアクセスできることから「幅広い年齢層のユーザーにキャンペーン参加を促せる」(DNP)という。 モバイルインパルスでは、従来からこうした画像認識システムを開発しているが、認識できるのは雑誌やカタログなどに掲載された商品写真を、2次的に撮影した画像だった。今回のシステムでは商品実物の撮影画像も認識できるようにした。 撮影角度/部位による画像の変化をシステムが自動認識し、データベースの画

    DNP子会社、立体物画像認識システムでの携帯向けキャンペーンサイト構築を開始
    tototti
    tototti 2006/09/01
  • MS、開発中の「Photosynth」を披露--写真から3D画像を作成

    ボストン発--Microsoftが、写真集をナビゲーション可能な3D空間に変換する写真ブラウザを開発している。 Microsoft Live Labsとワシントン大学の作業グループの代表者らは米国時間8月2日、「SIGGRAPH 2006」で行われた同校の「Photo Tourism」システムに関する講演のなかで、「Photosynth」ブラウザを披露した。Microsoft Live Labsでは、Photo Tourismの技術をベースにPhotosynthブラウザを開発し、インターネットベースの個人向けサービスとして提供したいと考えている。 MicrosoftのInteractive Visual Media Groupを率いるRichard Szeliski氏は、「Photosynthは、大量の写真を見て回れるウェブクライアントとしてリリースされる」と述べた。Photosynthは

    MS、開発中の「Photosynth」を披露--写真から3D画像を作成
    tototti
    tototti 2006/08/03
  • 花王、私ってどんな顔? 20台のカメラが「他人の視点」で光学的に評価

    花王(尾崎元規社長)は2月20日、あらゆる角度から顔を同時撮影できる「多視点画像解析システム」を開発したと発表した。 上下左右に設置した20台のカメラと50台のライトでさまざまな光の条件のもとで顔を同時に撮影し、解析ソフトにより画像を光学的に定量評価する。 顔の表情は自然な状態のまま、正面をはじめ横や斜めなど、他人の視線で見た自分の顔画像を知ることができ、メイクの仕上がりや素顔がどのように見られているかを客観的に確認できる。 また、屋外、室内といった条件で光をコントロールしながら、角度の違いで異なる、肌の見え方の微妙な変化が、どのように顔全体の美しさや印象に与えているかを評価することもできる。撮影した画像を「色」「明度」「反射」「散乱」などの光学的な数値や情報を視覚化する画像解析を使って、メイクの仕上がりや素肌の美しさの定量的な評価を得ることも可能。同社ではシステムで収集した解析データを今

    花王、私ってどんな顔? 20台のカメラが「他人の視点」で光学的に評価
    tototti
    tototti 2006/02/21
    20台もカメラがあれば3次元復元もできそう。
  • 1