WEBINAR | AI Prototype to Production: Operationalizing and Orchestrating AI
![Clarifai, the AI Workflow Orchestration Platform](https://cdn-ak-scissors.b.st-hatena.com/image/square/c666d63d964947eca0752747e20f265c508816fb/height=288;version=1;width=512/https%3A%2F%2Fwww.clarifai.com%2Fhubfs%2Fsocialshare-image.png)
概要 画像補完技術とは画像の欠損部分をそれらしく埋め合わせる技術のことをいう。この技術は古くから職人技として知られ、傷んだ写真の修復や写真からのトロツキーの除去などに広く用いられてきた。 近年では画像補完を自動的に行う技術の発展が目覚ましい。Hays らは、風景画像の欠損部分に合う画像を風景画像データベースから検索することで、風景画像の一部をまったく違う(しかし見た目には自然な)風景画像へと置き換えることに成功している。このような外部画像データベースを用いる手法は一種の「脳内補完」として機能しているといえる。 ところで、一般に「脳内補完」の主要な適用先は着衣状態の無着衣化である。彼らの手法のうち、風景画像データベースを裸体画像データベースへと置き換えることで、着衣画像の裸体化が行えることが期待される。 本プロジェクトでは上記着想の実装を行い、その実験結果を示す。 なお、本プロジェクトページ
人間は写真を見てそれがどういった場面なのかを説明することができますが、これはコンピューターにとっては非常に難しいことです。しかし、Googleの研究者は機械学習システムを用いて一度写真を見れば自動でその状況を説明するようなキャプションを生成できる、というまるで人間のような能力を持ったシステムの開発に成功しています。 Research Blog: A picture is worth a thousand (coherent) words: building a natural description of images http://googleresearch.blogspot.jp/2014/11/a-picture-is-worth-thousand-coherent.html 近年の研究では、物体の検出や分類、ラベル付けなどの技術が大幅に向上しています。しかし、人間のように複雑な状
あけましておめでとうございます。以前このgihyo.jpで「OpenCVで学ぶ画像認識」というタイトルで連載をさせていただいた皆川です。 今回、技術評論社様から「コンピュータ・ビジョンの今」についての執筆依頼をいただきました。私が普段ウォッチしている業界や技術分野には偏りがあるため、俯瞰的な形での解説は難しいかもしれませんが、私の独断と偏見で最近の動向についてまとめてみたいと思います。 ここでは、主に以下の3点について述べさせていただければと思います。 ビジネスでの動向 アカデミックでの動向 コミュニティでの動向 「コンピュータ・ビジョンってなに?」という方は、「OpenCVで学ぶ画像認識」の第1回をお読みください。 ビジネスでの動向 拡張現実感(AR) 昨年、IT業界で間違いなく一つの流行語となったのは“拡張現実感(AR: Augmented Reality)”でしょう。ARは現実
この連載では、この表で言う画像認識技術を主に扱いますが、どの技術も非常に活発に研究されており、様々な分野で実用化されています。 画像認識・理解の基本原理 画像認識の基本原理 画像認識は、学習のフェーズと認識のフェーズの2つからなります。学習のフェーズでは、コンピュータに認識させたい対象画像を学習させる処理を行い、認識のフェーズではコンピュータに入力画像が学習した対象かどうかを判定させます。 図5 学習と認識の流れ 学習フェーズ 学習のフェーズでは、まず画像になんらかの処理を施して、ピクセルのデータ列から、より学習に適したデータ列(特徴量データ)へと変換を行います。 次に変換されたデータを、機械学習と呼ばれるアプローチを用いてコンピュータに学習させます。機械学習とは、その名の通り人間が行っているような学習の仕組みをコンピュータに持たせるための技術です。例えば人間は、初めて見る人の顔画像でも、
コンピュータビジョンの理論とアルゴリズムを基礎から学べる実践的な入門書。理論の説明にとどまらず、ベクトル演算や行列演算を駆使したサンプルを示しながら物体認識、3次元復元、ステレオ画像、拡張現実感、その他の応用について解説します。サンプルプログラムはPython 2.7で書かれています。OpenCVを使うだけではコンピュータビジョンの本質を理解できません。forループでピクセルを操作し行列を計算する時代でもありません。Pythonの数値演算ライブラリを使えば、ほどよい粒度でコンピュータビジョンの基礎を学べます。各章末には演習問題が用意してあります。演習問題を解くことで自分がその章で何を学んだのか、また自分の理解度を確認できます。 ●本書で扱うサンプルプログラムの説明(サンプルコードは「関連ファイル」タブページからダウンロード可)。 翻訳者の相川氏のブログには、本書の追加情報や関連する技術情報
「海外ではABテストが盛ん」という言葉を耳にし、その内容が気にはなるものの、実際にそのノウハウや事例を外国語で仕入れるのは一手間だと、先送りにしてしまう人も多いのではないでしょうか。(かくいう私も「先送り」の日本代表です。) そんな皆様の一手間を解消すべく、海外のABテストの事例とその要点を日本語でまとめてみました。 普段から気になっている海外の事例を、どうぞサクッと日本語で仕入れちゃってください。 ※本記事は2014年5月19日に公開された記事をLISKUL編集部にて再編集したものです。 グローバルナビゲーションの削除とフォームの変形でCVR336%http://unbounce.com/a-b-testing/how-a-single-a-b-test-increased-conversions/ ・オリジナルページの特徴は、上部に分厚いグローバルナビが配置されていることと、右カラムに
グーグルの猫以来、ディープラーニングに興味を持っている人自体は多いものの、(自分も含めて)理解して実装できる人はそう多くないように思われます。 そんな人がステップアップできそうな本がありました。 コンピュータビジョン最先端ガイド6 (CVIMチュートリアルシリーズ) 作者: 藤代一成,高橋成雄,竹島由里子,金谷健一,日野英逸,村田昇,岡谷貴之,斎藤真樹,八木康史,斎藤英雄 出版社/メーカー: アドコムメディア 発売日: 2013/12/11 メディア: 単行本 この商品を含むブログを見る 第四章で東北大学情報科学研究科の岡谷貴之さん、齋藤真樹さんによるディープラーニングの詳しい解説があります。 私もまだほとんど読んでないのでアレですが、ディープラーニングとしてニューラルネットワークが注目された経緯、畳み込みニューラルネットワーク(CNN)やオートエンコーダの詳しい解説、ソフトウェア(The
査読付き学術論文誌「あの人の研究論文集 Vol.4 No.2」に、私の執筆した論文「画像補完技術による衣服の除去」が採録されました。私が水面下で開発していた真に革新的なプロダクトに関するものです。人類のロマンであるところの、着衣の透視を実現します。具体的には、以下の画像のようなシステムを実現します。本記事に掲載した画像には強いモザイクをかけていますが、実際の紙面ではモザイクはありません。(一部黒塗りがあります。)上の画像が二次元画像を用いた例、下の画像が三次元画像を用いた例です。この図ではモザイクが粗すぎてわかりにくいかもしれませんが、お察しください。英語力に自信がないのであれなのですが、論文の概要は以下の通りです。Abstract: This paper proposes a novel method to remove clothes in images. When an image
鷹の群れのようなドローンでマッターホルンを撮影し、正確な3Dデータに(動画)2013.10.20 22:00 mayumine グランド・セフト・オートみたいです。 スイスはアルプスの名峰、マッターホルンの非常に正確で詳細な3Dスキャニングが、スリル満点の冒険のようなゲーム感覚でできるなんて楽しそうです。最近のドローン技術では、山の頂上まで飛んでスキャンして、マッピングして、写真まで撮影できるなんてすごい時代になったものです。 軽量で自律する鷹のようなドローンはsenseFly社によって開発されました。6時間かけてマッターホルンを徘徊しあらゆる角度で撮影します。 この空を飛ぶ黒い兵隊は2000枚以上の高解像度の写真を撮影し、Pix4Dと呼ばれるソフトウェアで分析、300万のデータポイントから構成して非常に精細にモデリングを行います。ドローンが測量ツールで山の表面を正確に捉えることが出来なく
もしもたった一人、砂漠を車で旅行していたときに、車が動かなくなってしまったらあなたはどうするだろうか? 最寄りの村落まで数十キロ、水とわずかな食料しかない。通信手段はなく、歩いて村落までたどり着けるかどうかさえもわからない。 フランス人エミル・ルレイは、予想外の方法でその困難を乗り越えた。彼は動かなくなった車を分解し、不十分な工具でバイクを組み立てたのだ。これはエミルの冒険物語である。 1993年のこと、エミルはモロッコ南部の都市、タン・タンを出発しサハラ砂漠を縦断しようとしていた。街を出たのちにアクシデントが発生した。その当時モロッコは内戦で軍事的な緊張が高まっており、現地で活動していた「フランス国家憲兵隊」によって、タン・タンに引き返すように指示されたのである。 旅は突然の終了を告げていたのだが、彼は軍の指示を聞き入れなかった。しかしそのまま先に進むわけにも行かず、正規のルートを大き
今まで自分が見つけたコンピュータビジョンの研究に役に立ちそうなフリーのライブラリやソースコードをまとめてみました。自分ではまだ使っていないものも多いので、そこはご容赦を。主にC/C++が中心です。 またライブラリ形式でない、いわゆる学会で発表した研究のコードをそのまま公開しているという人がたくさんいて、それに関しては特にメジャーなもののみ紹介しています。なにぶん僕の観測範囲は限られてますので、「このライブラリに触れないのはおかしい」、「説明が間違っている」等、ご意見大歓迎です。 定番(Standard) OpenCV 定番中の定番です。コンピュータビジョンに関して広範なアルゴリズムが実装されています。 http://code.opencv.org/projects/OpenCV/wiki/WikiStart Point Cloud Library 3次元点群データを扱うならこれ。Kinec
Por ocasião do lançamento do seu primeiro smartphone com 2 cartões - Galaxy Y Duos - a Samsung fez algo surpreendente: uma projecção mapeada na cara de um humano! Este vídeo usa por inteiro a técnica de projecção mapeada para construir várias personagens numa face humana. As imagens foram projectadas directamente sobre um actor que serve como tela. Esta técnica de video-mapping, anteriormente vis
When capturing photos in a busy area, like a public square or a concert for example, it is often difficult to get a clean shot without unwanted objects entering the frame. Now you can capture the shot anyway, and simply let the camera remove the people for you! Point your camera and take a photo. Afterwards you can remove anyone moving around, or select your friends and remove any strangers.
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く