並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 28 件 / 28件

新着順 人気順

"image recognition"の検索結果1 - 28 件 / 28件

  • ディープラーニングでおそ松さんの六つ子は見分けられるのか 〜実施編〜 - bohemia日記

    前回、おそ松さんたちをディープラーニングで見分けるため、準備編としておそ松さんたちの顔画像を5644枚集めました。 今回はそれを用いて、ディープラーニングで学習させ、判別器を作って検証します。 集めた画像 人物 枚数 例 おそ松 1126 から松 769 チョロ松 1047 一松 736 十四松 855 とど松 729 その他 383 使用フレームワーク 最近GoogleからTensorFlowという新しいディープラーニングのフレームワークが発表されました。 会社のブログに使い方書いたのですが、まだ慣れていないので、今回はchainerを使います。こちらだとすぐに高い成果を上げているImageNetのNINモデル、4層畳み込みニューラルネットワークがサンプルで入っていますので、こちらを改良して使います。 imageNetの使い方は、こちらやこちらを参考にしています。 訓練データセット Im

      ディープラーニングでおそ松さんの六つ子は見分けられるのか 〜実施編〜 - bohemia日記
    • 写真に基づく3D空間構築手法の到達点 - A Successful Failure

      一昔前は実世界の建築物を元にウォークスルー可能な3D空間を構築しようと思ったら、まず各部屋の形状を計測器を用いて計測し、その計測結果に基づいて人手でモデル化し、領域ごとにテクスチャを貼り、照明を設定して……と気の遠くなるような作業が必要だった。3D空間の構築は極めてコストの高い作業だったが、近年では2次元画像(実写写真)に基づいた3D空間の構築手法が長足の進歩を遂げており、以前に比べれば極めて低コストに3D空間を構築する事が可能となっている。 【告知】Twitterはじめました。@LunarModule7です。 興味のあるかたはフォローくださいとしばらく宣伝。 今ではバラバラに撮影した写真から、全自動で3D空間を構築し、内部を自由にウォークスルーできるようになっている。ワシントン大学とMicrosoft Reseachが2009年に発表した研究*1は現時点における集大成とも言えるものとなっ

        写真に基づく3D空間構築手法の到達点 - A Successful Failure
      • セクシー女優で学ぶ画像分類入門

        ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement LearningPreferred Networks

          セクシー女優で学ぶ画像分類入門
        • Deep Learningでラブライブ!キャラを識別する - christinaの備忘録

          このところDeep Learningが相当流行っているようで、ほとんど至るところで話題になっているのを見ます。 Deep Learningは深層学習とも呼ばれ、ニューラルネットワークの層をこれまでより深くして機械学習を行う技法です(だそうです)。 画像認識コンテストで他の方法と比べて非常に高い精度を示しており、以前は人の手で行っていた特徴の抽出まで行えます。 以前であれば車を認識するには車はどのような特徴を持っているかを人がモデル化して入力していたわけですが、この特徴を入力画像と与えられたラベルからニューラルネットワークが捉えてくれます。詳しいことはDeep Learningで検索して出てくる記事やスライドを参照のこと。 Deep Learning自体は容易に実装可能なものではなさそうですが、多くの研究グループがDeep Learningを行うためのソフトウェアをオープンソースにしているた

            Deep Learningでラブライブ!キャラを識別する - christinaの備忘録
          • TensorFlowでアニメゆるゆりの制作会社を識別する - kivantium活動日記

            ついにガロアが死んだ年齢を超えてしまったことに気がつき、自分がまだ何も成し遂げていないことを悲しく思う今日このごろです。 さて、今日はGoogleが出した機械学習ライブラリのTensorFlowの使い方について軽く説明しつつ、ゆるゆりの制作会社の識別を行おうと思います。 TensorFlowとは TensorFlowはGoogleが11/9に公開したApache 2.0ライセンスで使える機械学習ライブラリです。Googleは様々なところでプロダクトに機械学習を活用していますが、TensorFlowは実際にGoogle内部の研究で使われているそうです(TensorFlow: Google 最新の機械学習ライブラリをオープンソース公開 - Google Developer Japan Blog)。 Googleのネームバリューは恐ろしいもので、GitHubのStar数はすでにChainerやC

              TensorFlowでアニメゆるゆりの制作会社を識別する - kivantium活動日記
            • 数独を解く(画像解析) - cuspy diary

              画像として与えられた数独を解きます。 新聞に掲載されていたこの問題をOpenCVを使って画像解析する。(画像が斜めなのはワザとです) グレースケール変換画像解析の前処理として、まずグレースケールに変換し、ガウシアンフィルタをかけてぼかします。ガウシアンフィルタをかける事で、安定した二値化画像が得られます。 二値化次に二値化を行います。 二値化には、普通の方法、大津さんの手法、適応的二値化、などさまざまな手法が在ります。いろいろ試した所、適応的二値化(Adaptive Threshold)が最も数独の認識に適していることが解りました。 適応的二値化(Adaptive Threshold)であれば、影になってしまった部分も上手く処理できます。 膨張処理次に、数独の盤面の外枠を認識を行います。 二値化の影響で枠線が途切れてしまう可能性がありますので、膨張処理(dilate)を行います。 (膨張処

              • 友利奈緒判定botを作った - kivantium活動日記

                TVアニメCharlotteのヒロイン友利奈緒がTwitter上で異常に増殖する怪現象が起こっています。 友利奈緒検出器、川奈プロが3秒で実装しそうなやつだ— Ararik (@fimbul11) September 2, 2015 と煽られたので実装しました。(3秒ではできませんでした) 遊び方 @mitra_sun22に画像つきのリプライを飛ばせば顔と判定した部分に白枠をつけた画像と判定結果を返信します。簡単ですね! ちなみに友利奈緒と判定された画像は筆者(@kivantium)のTwitterアイコンに設定されるようになっています。 要素技術 Twitterで煽られたので、Twitterで送られた画像から顔を検出してその顔が友利奈緒かどうか判断してリプライするという仕様にしました。 ほとんど過去の記事からコピペしただけでできました。 Twitterからの画像を処理する部分: Twit

                  友利奈緒判定botを作った - kivantium活動日記
                • ご注文はDeep Learningですか? - kivantium活動日記

                  先日Deep Learningでラブライブ!キャラを識別するという記事が話題になっていました。この記事で紹介されている SIG2D 2014を知り合いから貸してもらったので参考にしながら、ご注文は機械学習ですか?のDeep Learning版を作ってみました。 Caffeなど必要なソフトのインストール Ubuntu 14.04の場合は過去記事を参照してください。これ以外にもpython-opencvなどを使いますが、依存関係の全ては把握できていないのでエラーが出たら適宜インストールしてください。 データの準備 Deep Learningでは大量の学習データが必要になると言われているので、まずは大量のデータを用意します。参考記事では6000枚のラブライブ画像を使ったということなので対抗して12000枚以上のごちうさ画像を用意したいと思います。それだけのデータを手動で分類するとそれだけで時間が

                    ご注文はDeep Learningですか? - kivantium活動日記
                  • DeepLearningで上司を認識して画面を隠す - Qiita

                    背景 仕事をしているとき、業務に関係ない情報を閲覧していることって誰でもありますよね? そんなときに背後にボスが忍び寄っていると気まずい思いをします。もちろん急いで画面を切り替えれば良いのですが、そういう動作は逆に怪しまれることになりますし、集中しているときは気がつかないこともあります。そこで怪しまれずに画面を切り替えるために、ボスが近づいてきたことを自動的に認識して画面を隠すシステムを作ってみました。 具体的にはKerasを用いてボスの顔を機械学習し、カメラを用いて近づいてきたことを認識して画面を切り替えています。 ミッション ミッションはボスが近づいてきたら自動的に画面を切り替えることです。 状況は以下のような感じです。 ボスの席から私の席まではだいたい6,7mくらいです。ボスが席をたってから、4,5秒で私の席に到達します。したがって、この間に画面を隠す必要があるわけです。時間的余裕は

                      DeepLearningで上司を認識して画面を隠す - Qiita
                    • [Saq.] ARToolKit を Flash に移植したよ。

                      こんちわ。さくーしゃです。 えーと、巷では Flash Player 10 beta で騒がしい感じになってきておりますが、そんな中、わたくしは ARToolKit を Flash (AS3) に移植してました。FLARToolKit と命名しておきましょう。まー、移植つっても本家からじゃなくって A虎@nyatla.jp 氏が Java に移植した NyARToolkit を AS3 で書き直したものなんだけど。言語仕様が近いだけあって C 版よりもはるかに移植しやすかったですな。 やっぱでもねー、速度的にはかなり厳しいもんがあるな。ラベリングの部分は Bitmap 師匠のコードをベースにほとんど書き直したんだけど、それでも複数マーカーの認識とかってのはかなり無理がありそう。 3D 表示部分も現状の Flash だとソフトウェアレンダリング(デモでは Papervision3D 使ってる

                        [Saq.] ARToolKit を Flash に移植したよ。
                      • http://www.nicovideo.jp/watch/sm2028210

                        • ディープラーニングでおそ松さんの六つ子は見分けられるのか? 〜準備編〜 - bohemia日記

                          最近おそ松さんというアニメが流行っていますね。 6つ子のおそ松くんのアニメを現代版にアレンジした作品なのですが、その過程でそれぞれの兄弟の特徴が付けられています。 左から、おそ松、から松、チョロ松、一松、十四松、とど松で、順に長男次男三男・・・となっています。 簡単にまとめると、このようになります。 生まれ 名前 色 特徴 長男 おそ松 赤 クズ 次男 から松 青 ナルシスト 三男 チョロ松 緑 ツッコミ、意識高い系 四男 一松 紫 コミュ障 五男 十四松 黄色 マイペース 六男 とど松 ピンク 甘え上手、腹黒 それぞれの色を着ているときは、簡単に見分けられますが、そうでないときは見分けるのに困難を伴います。 髪や目つきにも特徴があるので、見分けることができるので、このような表を作ってらっしゃる方もいます。 それでも結構苦労したので、同じくディープラーニングで学習させたモデルで判別できない

                            ディープラーニングでおそ松さんの六つ子は見分けられるのか? 〜準備編〜 - bohemia日記
                          • http://www.acvt.com.au/research/videotrace/

                              http://www.acvt.com.au/research/videotrace/
                            • mash/Marilena - Spark project

                              Marilena とは OpenCV の Object Detection を AS3 に移植したやつです。 OpenCV の opencv-haartraining とかで学習した haar-cascadeのxml と、 画像を入力にして、 画像に含まれる顔の位置を、x,y,width,height の配列として出力します (学習はC使ってやって、AS3で認識する、ってことです) sample Marilena ObjectDetection in actionscript3 example: FaceDetection ソースコード http://www.libspark.org/browser/as3/Marilena 使い方 サンプルのソースをごらんください! 認識に使うxmlは一度zipに圧縮した後、Adler32 checksumというのを付加するスクリプト(tools/fzi

                              • 漢字を類似度検索可能にする (polog)

                                アイデアとしては単純で、画像情報に落としたあとで全漢字pairに対して全pixelの一致数をカウントするだけ。 これの時にはリアルに全漢字でやろうとしてたんだけど、2万字=>4億ペアなので断念した。常用漢字1945文字を対象とする。 ActiveRecordやら何やら使いたかったけど、普通にやると結構面倒だったのでrailsでプロジェクト作ってscript/runnerした。 ファイル rake db:migrateで create_table :chars do |t| t.column :char, :string t.column :byte, :integer end add_index :chars, :char add_index :chars, :byteこんなのと create_table :similarities do |t| t.column :c

                                • Google、携帯で撮った写真で検索できる「Google Goggles」を発表 - ITmedia News

                                  音声検索の日本語対応を発表したばかりのGoogleが、今度は撮影した写真をクエリとして利用する「Google Goggles」をLabsのサービスとして発表した。Android 1.6以上に対応する。 米Googleは12月7日、携帯電話のカメラで撮影した写真で情報を検索できるツール「Google Goggles」をGoogle Labsから試験的にリリースした。対応するのはAndroid 1.6以上を搭載した携帯電話。Android Marketから無料でダウンロードできる。 Google Gogglesを起動し、例えば書籍の表紙やワインのラベル、橋やビルなどのランドマークなどをAndroid携帯のカメラで撮影すると、Googleが関連すると判断した検索結果が表示される。 撮影された写真はGoogleのデータセンターに送信され、Googleが独自の視覚アルゴリズムで画像の特徴を解析し、画

                                    Google、携帯で撮った写真で検索できる「Google Goggles」を発表 - ITmedia News
                                  • 【検索雑談】Googleの画像文字認識の精度がいつの間にか高くなっていた話

                                      【検索雑談】Googleの画像文字認識の精度がいつの間にか高くなっていた話
                                    • DimP - A Direct Manipulation Video Player

                                      DimP is a video player prototype that allows to browse video clips by directly manipulating their content. The way it works is quite simple: DimP automatically extracts object motions from the videos. DimP then allows the user to control video playback by scrubbing these objects on their trajectories. Videos Longer video with explanations. [youtube]   [download] Demo You can download DimP for free

                                      • 漫画の吹き出しや効果音を自然に消す技術

                                        Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 香港中文大学とCaritas Institute of Higher Educationの研究チームが開発した「Seamless Manga Inpainting with Semantics Awareness」は、深層学習を使い、漫画のせりふの吹き出しや効果音を消して周囲と調和するように塗りつぶす手法だ。

                                          漫画の吹き出しや効果音を自然に消す技術
                                        • CCV.jsで顔検出 | ゆっくりと…

                                          CCV.js (C-based Computer Vision Library) は、オープンソースな画像処理ライブラリ OpenCV の純粋なアルゴリズム部分を一部 JavaScript に移植したライブラリです。しかも元のライブラリではかなりの仮想化・階層化されていた画像処理用メモリ管理部分を簡素化し、Canvas で扱えるようにしてありますので、現在のモダンブラウザでも動作する軽量なライブラリとなっています。 ライブラリとはいうものの、現時点はまだ物体検出のアルゴリズムしか移植されていないようなのですが、顔検出のサンプルがありましたので試してみました。 サンプル CCV.jsで顔検出 – jsdo.it – share JavaScript, HTML5 and CSS JavaScriptライブラリの中身 ccv を GitHub から落とすと、js ディレクトリに顔検出のサンプル

                                          • はてなブログ | 無料ブログを作成しよう

                                            来年も作りたい!ふきのとう料理を満喫した 2024年春の記録 春は自炊が楽しい季節 1年の中で最も自炊が楽しい季節は春だと思う。スーパーの棚にやわらかな色合いの野菜が並ぶと自然とこころが弾む。 中でもときめくのは山菜だ。早いと2月下旬ごろから並び始めるそれは、タラの芽、ふきのとうと続き、桜の頃にはうるい、ウド、こ…

                                              はてなブログ | 無料ブログを作成しよう
                                            • Googleイメージ検索はもう古い? CEATECは画像認識が面白い -@IT

                                              2007/10/03 千葉県・幕張で開催中の「CEATEC JAPAN」では画像認識技術に注目が集まっている。プロセッサの高速化と認識アルゴリズムの品質向上で、画像認識をシステムに組み込むための敷居が下がったことが背景にある。 北海道大学の長谷山研究室は経済産業省が主導する「情報大航海プロジェクト」の一環で開発した映像の次世代検索システム「Cyber Space Navigator」をCEATEC会場で公開している。このシステムはメタデータに頼らずに動画像や音声を検索する技術。動画像や音声そのものをクエリにして検索できる。Googleのイメージ検索などと異なり、1つの動画像、音声を指定すると、その動画像、音声に似たものを検索する。 タグなどのメタデータが不要なのは、動画像や音声をパターン化して、特徴を数値化するから。この数値を比較することで、似た動画像、音声を探し出す。動画像の検索で数値化

                                              • Engadget | Technology News & Reviews

                                                Apple's thinner new iPad Pros feature an M4 chip and "tandem" OLED displays

                                                  Engadget | Technology News & Reviews
                                                • 世界のナベアツに顔認識で挑戦する - swk's log

                                                  * 世界のナベアツに顔認識で挑戦する [tech] 16 users 世界のナベアツにさまざまな方法で挑戦するのが流行っているようなので,便乗してみる. http://www.kagami.org/nabeatsucv/ 入力された画像から認識された顔の数が,3の倍数か3のつく数字のときだけ顔がアホっぽくなります. CGI の実装言語は Perl,顔認識は Image::ObjectDetectモジュール (OpenCV の cvHaarDetectObjects),画像処理は Imagerモジュール,実装は以下の各サイトを参考にしました. OpenCVを使って画像の物体認識をするPerlモジュール作った - spiritlooseのはてなダイアリー 顔にエフェクトをかけてプライバシーを守るWebサービスの作り方 404 Blog Not Found:perl - 顔を認識するcgi 参考

                                                  • PICTORRIA: 最先端の一枚画像認識アルゴリズムをWeb APIでシェアするプラットフォーム | DERiVE コンピュータビジョン ブログ

                                                    Tweet 公開後に、まだ実際の運用は始まっていなくてComing Soonの状態が続いているサイトではありますが、以下の「PICTORRIA」という、起業家コンペから生まれたWebプラットフォームを紹介します。 http://www.pictorria.com このサイトは、Deva Ramanan先生のところの学生が起業家コンテストのアイデアとして作ったWebサイトのようで、最先端のCompute Visionによる画像認識アルゴリズムをシェアするためのサイトとなるそうです。(参考:彼らの出身である、カリフォルニア Irvine校による、起業家コンペの報告記事) PICTORIAでは、Deva Ramanan先生のラボの技術である、Deformable Part Modelsによる物体検出やFlexible Mixture of Partsによる人物姿勢推定などの、「パーツベース物体認

                                                    • http://www.vision.cs.chubu.ac.jp/cvtutorial/pdf/03objectdetection.pdf

                                                      • 富士フイルムビジネスイノベーション株式会社/FUJIFILM Business Innovation Corp.

                                                        本サイトは富士ゼロックスブランドの商品を含みます。富士ゼロックスブランドの商品は、米国ゼロックス社からライセンスを受けている商品です。 商品提供者は富士フイルムビジネスイノベーション株式会社です。 Xerox、Xerox ロゴ、およびFuji Xerox ロゴは、米国ゼロックス社の登録商標または商標です。

                                                        • グーグル、携帯画像で検索する「Google Goggles」を発表 : CNETニュース : ニュース : ネット&デジタル : YOMIURI ONLINE(読売新聞)

                                                          カリフォルニア州マウンテンビュー発--Googleの最初の検索エンジンは、ウェブページでテキストを入力して使うものだった。次に、電話による音声で検索クエリを入力するものが出てきた。そして米国時間12月7日、Googleは画像でインターネット検索を行う機能を発表した。 Googleのエンジニアリング担当バイスプレジデントであるVic Gundotra氏によると、実験段階にある視覚情報による検索機能「Google Goggles」は大量の画像データベースを備え、アップロードされた画像が何なのかを解析して報告するという。書籍、アルバムのカバー、アートワーク、風景、場所、ロゴなどを認識できる。 「どんな画像も特定可能にすることを目指している」とGundotra氏は語った。「コンピュータビジョン分野におけるGoogleの最初の取り組みだ。写真を撮影したら、何であれ検索クエリとして利用できるように

                                                          1