並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 322件

新着順 人気順

画像特徴量の検索結果81 - 120 件 / 322件

  • ICCV 2013 (1) - 東京大学中山研究室 研究日記

    中山です。 遅くなりましたが、先月シドニーで開催されたInternational Conference on Computer Vision (ICCV)の紹介をさせて頂きます。 ICCVは、CVPRと並ぶコンピュータビジョンの分野では最も権威のある国際会議です。CVPRの方は毎年米国で開催されますが、ICCVは隔年でECCVと交互に開催されています。内容的にはどちらも変わらず最高レベルの研究発表が行われますが、雰囲気はCVPRと結構違う印象を受けました。シングルトラックでセッションが組まれていることが大きいと思いますが、質疑応答などは以前参加したCVPRの方がずっと活発であったように感じました*1。 いずれにせよ、ビジョンのみならずさまざまな分野の研究者にウォッチされている会議であり、我々としては目指すべき場所の一つです。今回の採択率は久しぶりに30%を超え、少し間口が広がった印象があり

      ICCV 2013 (1) - 東京大学中山研究室 研究日記
    • 【記事更新】私のブックマーク「コミック工学(Comic Computing)」 | 人工知能学会 (The Japanese Society for Artificial Intelligence)

      松下光範(関大),山西良典(立命館大),松井勇佑(NII),岩田基(大阪府立大),上野未貴(豊橋技科大),西原陽子(立命館大),中村聡史(明治大) はじめに: コミック工学の概要 タブレットやスマートフォンなどの携帯ディジタル端末の普及に伴って,このような端末の上でコミック(以下,電子コミック)を閲読することが一般的になってきている.文献 [1] によれば,2016 年度の紙媒体のコミックが 1,947 億円(前年比7.4% 減)であったのに対し,電子コミックの販売金額は 1,460 億円(前年比 27.1% 増)に上り,ユーザの閲覧形態が紙媒体から電子媒体へと移行している様子が顕著に表れている.電子コミックは,ディジタル端末上でリアルタイムに処理可能であることから,紙媒体のコミックに比べ高い拡張性と応用性を有していると考えられる.例えば,従来のコミックの枠に囚われない表現(e.g., 話

      • #3 画像処理技術は現実を拡張するキモ 画像認識とスマホが開く未来とは─吉田悠一氏 | gihyo.jp

        IT専門の人材サービス・アウトソーシング事業を行うパソナテックが6月1日、渋谷のコワーキングスペースLightningspot内にWeb制作やスマホアプリ開発、ソーシャルマーケティング事業を展開する「渋谷Lab(ラボ⁠)⁠」をオープンしました。本記事では、オープニングイベントとして5夜連続で開催した「shibuya meets tech」イベントの様子を紹介します。 6月4日から8日の5日間にわたって開催されたトークセッション「shibuya meets tech⁠」⁠。パソナテックによる本イベントは、現場の一線で活躍しているエンジニア、クリエイター7名をゲストに招き、現場に起きている変化を考察しつつ、参加者とディスカッションしながら未来を展望するというもの。6月6日には、デンソーアイティーラボラトリの吉田悠一氏が登場、「⁠実世界とデータを結ぶ!画像処理技術×スマホのこれから」と題したセッ

          #3 画像処理技術は現実を拡張するキモ 画像認識とスマホが開く未来とは─吉田悠一氏 | gihyo.jp
        • Chainer とAnnoyを使った 類似画像検索 【入門】 - Qiita

          はじめに 今回は以前の書いた記事(類似画像検索のための、Pythonを使った近似最近傍探索【入門】)の続きで、Deep Learningの特徴量抽出と近似最近傍探索を使って類似画像検索を実装します。 類似画像検索とは特徴ベクトル $\boldsymbol{x}$で表現された画像に近い画像をデータベースの中から探すことです。データベースのすべての画像と類似度を比較していると膨大な計算量になり時間がかかるので、効率よく似ている画像を探しだすことが求められます。 類似画像検索はSNSのPinterestのズームイン検索という機能に使われています。以下の例でいうと、左の画像で囲ったキーボードの画像を使って、類似画像を検索し表示しています。リモコンのようなものを検索されていますが、色や形状などが似ている画像を表示することができます。 Deep Learningを使って類似画像検索を実装する方法は基本

            Chainer とAnnoyを使った 類似画像検索 【入門】 - Qiita
          • OpenCVの補助として使うscikit-image ~同時生起行列特徴量~ - drilldripper’s blog

            OpenCV 画像処理の代表的なライブラリといえばOpenCVだと思います。C++やPythonなど複数の言語で使用することができるため、アプリケーションへ組み込む際に利用することも多いと思います。 OpenCVにはたくさんの関数が実装されていて非常に便利ですが、画像処理の範囲が広いため、網羅しきれていない機能が多々ありあます。私は特に画像特徴量を扱う機能が心もとないと感じています。 scikit-image scikit-imageはPythonの画像処理ライブラリです。このライブラリはSciPyというPythonの科学ライブラリから派生したものです。同じ経緯で作られたscikit-learnは機械学習ライブラリとして広く使われています。 scikit-imageはその出自から、特徴量や認識に関するアルゴリズムに強いという特徴があります。 Python版のOpenCVとscikit-im

              OpenCVの補助として使うscikit-image ~同時生起行列特徴量~ - drilldripper’s blog
            • 日立システム、数百万件の画像を1秒で検索可能なソリューション提供

              日立システムアンドサービス(日立システム)は7月30日、日立製作所の画像検索技術「EnraEnra(エンラエンラ)」を利用したサービス「画像検索ソリューション」を提供すると発表した。8月3日より提供を開始する。 EnraEnraは、数千万件の画像データから、指定した画像と類似した画像を約1秒で検索可能な技術。画像の色分布や輝度勾配パターン分布を数値ベクトル化した「画像特徴量」をもとに類似画像を検索する。このため、キーワードが付与されていない画像も検索できるという。 検索結果は類似している順に表示され、キーワードや作成日時の情報と併用した絞り込み検索も可能。これにより、形や色を重視した検索や、撮影した写真と類似した商品を検索できるようになるとする。 画像検索ソリューションでは、同社が類似画像検索エンジンの導入から設計、構築、運用保守までを担う。主な機能には、画像データとメタ情報をサーバに登録

                日立システム、数百万件の画像を1秒で検索可能なソリューション提供
              • 日立、数百万件の画像データから1秒以内で類似画像を検索できる技術を開発

                日立製作所は7月24日、数百万件規模の画像・映像データの中から、指定した画像と類似した画像を1秒以内で高速検索できる類似画像検索技術を開発したと発表した。 類似画像検索技術は“見た目が似ている”画像を検索する技術。画像間の類似性の評価は、画像の色の分布や形状等、画像自体が持つ情報を自動的に抽出し、高次元の数値情報として表現した「画像特徴量」に基づいて行われる。 今回開発された技術は、画像データを保存する時に、類似したデータ同士をまとめる「クラスタリング処理」と、画像特徴量のデータをハードディスクドライブ(HDD)に保存する際の記録場所の最適化を行うことで、高速かつメモリ消費量を抑えた検索を可能にしたもの。これで、PCを用いて数百万件規模の画像データの中から類似した画像を検索した場合、1秒以内で検索することができる。 映像検索にも適用することができ、例えば、1万時間分の映像の中から、好きな芸

                  日立、数百万件の画像データから1秒以内で類似画像を検索できる技術を開発
                • GPU搭載ノートPCにUbuntuとCUDAを入れるのに挫折した - bohemia日記

                  少し前に、GTX960M搭載のAlienware 13-R2を購入した。当初は予定になかったのだが、このPCをWindows10/Ubuntu14.04でデュアルブートし、CUDAを入れ、ChainerやTensorflowをGPUで学習を回せる環境を作ろうとしたのだが、問題が多すぎて挫折してしまったので、後の誰かのためと、万が一誰か問題を解決してくれる望みを託して記事を書いた。 なんでそんな環境作ろうとしたのか? きっかけは、参加した超人工生命ハッカソン 。 Unityで作った環境上で人工生命を作るというハッカソンだった。 元となるソースは用意されていて、UnityとPythonをソケット通信で繋ぎ、CNNとDQNを用いて人工生命を学習させていくというものだった。 こんな感じ 普段使用しているmacを持って行ったのだが、やはりGPU無しのmacでは、DQNの動作も遅く、1秒間に2フレーム

                    GPU搭載ノートPCにUbuntuとCUDAを入れるのに挫折した - bohemia日記
                  • 東京大学中山研究室 研究日記

                    こんにちは。玉那覇です。 M1数名で赤門前の居酒屋「こだわりや」に行ってきたので、レポートしたいと思います。 唐揚げがおいしい店とのことなので、今回は唐揚げ食べ放題(1時間1,080円)に挑戦しました。 揚げたての唐揚げです。一つ一つのサイズが大きくなかなかボリュームがあります。 ワインと唐揚げのおいしい店を自負するだけあり、味も美味しいです。 なんやかんやの流れで僕、岩瀬、富樫 vs 岩本の大食い対決をすることになりました。 僕らは普通の量食べれば勝てますが、岩本君は3倍の量を食べなければ勝てません。 注文した唐揚げが来る前にさらに追加の注文をする、という小技を使いながらハイペースで 唐揚げを胃袋に押し込んでいきます。 ところで皆さんこの野菜の名前が何かわかりますか? 岩本君はこの野菜をサンチョと呼ぶらしいです。流石です。 そんなサンチョ岩本氏もそろそろ限界が近い様子。 気がつけば箸の動

                      東京大学中山研究室 研究日記
                    • 【 基礎調査 】複数のセンサ感覚データ(特徴量)を統合して、「マルチモーダル学習」(マルチモーダル特徴量)を得るための手法いろいろ - Qiita

                      【 基礎調査 】複数のセンサ感覚データ(特徴量)を統合して、「マルチモーダル学習」(マルチモーダル特徴量)を得るための手法いろいろMachineLearning機械学習人工知能DeepLearningディープラーニング 複数のセンサ感覚データ(特徴量)を統合して、「マルチモーダル学習」(マルチモーダル特徴量)を得るには、複数の手法があるようです。 本記事では基礎調査として、それぞれの手法の分析実例について、Google 検索 で見つかった公開 先行研究論文 を引用することで、発見された手法の仕組み(アルゴリズム)と その使い方(複数の特徴量 どうしの統合手順)をまとめていきます。 ( 設問 ) 複数の特徴量データ(個々の感覚情報)を、どのような方法で、統一的な全体的な1つの特徴量に 統合するのか? 1.Slow Feature Analysis (SFA) を 階層的に 重ねる方法 西川

                        【 基礎調査 】複数のセンサ感覚データ(特徴量)を統合して、「マルチモーダル学習」(マルチモーダル特徴量)を得るための手法いろいろ - Qiita
                      • MIRU2017参加報告 - ZOZO TECH BLOG

                        こんにちは、データチームの後藤です。 VASILYデータチームは2017年8月7日〜10日にかけて、広島で行われた第20回画像の認識・理解シンポジウム(以下、MIRU2017)に参加しました。本記事では、発表の様子や参加した感想をお伝えしたいと思います。 MIRU2017 MIRUはMeeting on Image Recognition and Understandingの略で、国内最大規模の画像の認識と理解技術に関する会議です。事前に選定された口頭発表と国際会議の採択論文から選ばれた招待講演を中心に、ポスター発表、デモ発表、特別講演で構成されます。 今年の投稿件数は、以下のような内訳でした。 口頭発表:23件 一般論文:206件 デモ論文:13件 招待講演:12件 企業展示:15件 VASILYのデータチームは「トリプレット損失関数の重み付けによる学習の効率化」というタイトルで一般論文

                          MIRU2017参加報告 - ZOZO TECH BLOG
                        • Hayato Kobayashi

                          Software engineer in natural language processing and machine learning. Email: hayato.kobayashi at gmail.com URL: http://hayatokobayashi.com/ Recent interest: Real-world application of NLP/ML Note: I am neither a Gundam character nor a French chef :-] Misc: Google Scholar, DBLP, GitHub, Twitter(ja), Patentfield(ja), Biography Work Experience Nov. 2021 - present: Software Engineer at Google (Tokyo,

                          • GIST特徴抽出 - n_hidekeyの日記

                            GISTは代表的な大域的画像特徴量(画像全体から求まる特徴ベクトル)の一つです。コンピュータビジョン、特に一般物体認識の大家であるA.Torralbaらによって開発された特徴量*1で、現在でもしばしば用いられます。コピー画像検出タスクなどでは、bag-of-words (BoW)に匹敵する性能が得られることも報告されています*2。画像特徴とってみたいけど、BoWはなんかめんどくさそう・・・という人にはおすすめです。 本家のページでMatlabのコードが提供されています。 http://people.csail.mit.edu/torralba/code/spatialenvelope/ また、これまた有名なINRIAの研究グループがCのコードを提供しています。 http://lear.inrialpes.fr/software (一番下) こちらを使ってみることにします。 コンパイルにはf

                              GIST特徴抽出 - n_hidekeyの日記
                            • Atsushi TATSUMA Web Page » Python と OpenCV で手軽に近似最近傍探索をする

                              はじめに 近似最近傍探索は、その名のとおり、k-近傍探索の高速な近似手法です。 大量にあるデータから、検索クエリのk-近傍となるデータを、高速に探してくる技術です。 近似最近傍探索の有名ライブラリに、FLANN(Fast Library for Approximate Nearest Neighbors)があります。 FLANN 自体、独立したライブラリとして存在しているのですが、OpenCV にも組み込まれています。 しかも、OpenCV の Python インターフェースからも叩けます。 各ライブラリのバージョン Python から FLANN へデータを渡すには Numpy の行列オブジェクトを用います。 今回は、以下の環境で、実行を確認しました。Python、Numpy、OpenCV は独自にビルドしたものです。 Debian GNU/Linux 6.0.5 Python

                              • 3次元物体検出もシンプルにTransformerで!PETRv2を理解する

                                Turing株式会社のアドベントカレンダー2日目です!1日目はCTOの青木さんのカレー屋さんとスタートアップ:CTO of the year 2023でオーディエンス賞受賞です。 自動運転・AIモデル開発チームの岩政(@colum2131)です。 Turingは完全自動運転車の開発を目標としており、自動運転AIや車両、LLMの開発など様々なことに取り組んでいます。今回の話は、自動運転AIの物体認識などのPerceptionタスクにおいて個人的に面白いなと思ったVision-CentircなEnd-to-Endモデルの紹介です[1]。 Transformerベースの画像認識 Transformerは、大規模言語モデル(Large Language Model; LLM)などに用いられる重要なアーキテクチャです。2017年に"Attention Is All You Need"というタイトルで

                                  3次元物体検出もシンプルにTransformerで!PETRv2を理解する
                                • 3000円の液晶付きAIカメラでオフライン転移学習する #M5StickV - Qiita

                                  はじめに 液晶ディスプレイ・カメラ・マイク・深層学習用推論モジュールなどを搭載し、約3000円で入手できるAIカメラである M5Stack社の M5StickV を利用して、デバイス単独で画像のリアルタイム学習・推論を行う拙作アプリ Brownie の実装について説明します。 下記が Brownie の動作の一例です。パー、グー、チョキの順に1回ずつ学習していくと、それぞれがだんだん識別できるように学習されていく様子が分かると思います。 Brownie Learn で、まっさらな状態から少しずつじゃんけんを学習していく様子です。数字が小さいほど自信ありです(登録時の画像の特徴ベクトルとの距離の2乗)。 https://t.co/GX1jR1mbJ8 #M5StickV pic.twitter.com/nrvSSGpyHN — ミクミンP/Kazuhiro Sasao (@ksasao) A

                                    3000円の液晶付きAIカメラでオフライン転移学習する #M5StickV - Qiita
                                  • Transformer を物体検出に採用!話題のDETRを詳細解説!

                                    はじめに Transformerを物体検出にはじめて取り入れた「DETR(DEtection Transformer)」が2020年5月にFacebookから発表されました。DETRは人間による手作業を大幅に減らすことに成功し、End-to-Endモデルに近く誰でも利用しやすいモデルになっています。また、「水着があるなら、一緒に写っている板のようなものはサーフボードである確率が高い」など、一枚の画像内にあるオブジェクト間の関係性を利用する形で物体検出が可能になりました。こうしたことがどうして可能になったのかを以下で見ていきたいと思います。 なお、Transformerに関しては一定程度の理解がある前提で説明しております。Transformerに関しても記事を作成しておりますので、下記をご参照ください。 公式論文 「End-to-End Object Detection with Trans

                                      Transformer を物体検出に採用!話題のDETRを詳細解説!
                                    • "Data Analysis Techniques to Win Kaggle" table of contents /「Kaggleで勝つデータ分析の技術」の目次 - threecourse’s blog

                                      This is table of contents of a book "Data Analysis Techniques to Win Kaggle (amazon.co.jp) written in Japanese and published on Oct. 2019. Authors are threecourse, Jack, hskksk, maxwell . en ja Data Analysis Techniques to Win Kaggle Kaggleで勝つデータ分析の技術 Chapter I: What is data analysis competition? 第1章 分析コンペとは? 1.1 what is data analysis competition? 1.1 分析コンペって何? 1.1.1 what do you do in competition?

                                        "Data Analysis Techniques to Win Kaggle" table of contents /「Kaggleで勝つデータ分析の技術」の目次 - threecourse’s blog
                                      • しましま/人工知能学会全国大会2016 - 機械学習の「朱鷺の杜Wiki」

                                        人工知能学会第30回全国大会† このページはしましまが人工知能学会全国大会2016に参加してとったメモです.私の主観や勘違いが含まれていたり,私が全く分かってなかったりしていますので,その点を注意してご覧ください.誤りがあれば,指摘してください. ホームページ: http://ai-gakkai.or.jp/jsai2016/ 日時:2014年6月6日(月)〜 6月9日(木) 会場:北九州国際会議場他(福岡県北九州市) ↑ 1C2-1 画像特徴量を利用したユーザプロファイルの拡張とローカルショップ推薦への応用† 井 源(筑波大学システム情報工学研究科) 延原 肇(筑波大学/システム情報工学研究科/知能機能システム専攻) 横石 圭介(株式会社サイバード) 大東 佑太(筑波大学システム情報工学科知能機能システム専攻) 利用者の過去の行動履歴中の画像とFBから得た近所の店舗の画像をマッチングして

                                        • 画調 画風の特徴量分析   : 研究開発

                                          総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習、データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 画像中に存在する物体.....描写されている「事象」の特徴量は SIFTなどでも抽出可能でしょう しかし、画像そのもの、「画風」の特徴量はどうやったらわかるでしょうか? 感性情報による類似画像群の分類 石井眞 相模女子大学 図学研究 37(4), 2003 人間が添付した外部情報(meta data)を用いるとは、案外確実です。 2.類似画像群構築の可能性 本章では,印象語を用いた類似画像群の検索可能性に対する知見を得るため, 評価者が主観的に分類した類似画像群と評価者の入力値である印象度[石井眞人,近藤邦雄,佐藤尚

                                          • 素材表面のテクスチャを知覚する脳メカニズムを解明

                                            私たちの持つ重要な視覚機能の一つに様々な素材(木材、金属、布など)の表面のテクスチャを識別する能力が挙げられます。この機能が私たちの脳内のどのような働きで実現されているのか多くは知られていませんでした。今回、自然科学研究機構 生理学研究所の小松英彦教授、岡澤剛起研究員および理化学研究所の田嶋達裕研究員(現所属:ジュネーヴ大学)のグループは、ヒトと近縁な種であり高度に視覚機能の発達したマカクザルがテクスチャを見ているときの脳活動を計測し、得られた活動が、以前米国の研究者の開発したコンピュータ上のモデルにより部分的に説明できることを明らかにしました。本研究結果は、米国科学アカデミー紀要(2014年12月23日オンライン)に掲載されます。 私たちが目にする多くの物体の表面には、様々なテクスチャが存在し物体固有の質感を生み出します。テクスチャを識別する視覚の機能は、物体の素材の判断(木材、金属、布

                                              素材表面のテクスチャを知覚する脳メカニズムを解明
                                            • AIで画像の美しさを評価する LAION Aesthetics - A Day in the Life

                                              画像の美しさ、というのは主観が多分に含まれるものなので、コンピュータが評価するタスクとしては難しいのかな、と思っていたのだけどLAION-AESTHETICS を読んでびっくり、だいぶきちんと評価できてそう。実際にLAION Aesthetics V2でデータセットをスコア付した結果(リンク先ページは大量の画像ロードが走って遅いので注意)ではこんな感じ。例えばスコアが1.5~1.75の画像だと となる。またスコア7~7.25の画像では という感じになる。おーすごい、それっぽい。そしてこのスコアを学習・導出しているものも複雑なディープラーニング処理ではなく、単純なMLP(5つの線型層+Dropoutで、活性化関数を挟まない)というのもすごい。 LAION-Aesthetics V1 V1 では SAC というStable Diffusion等が生成した画像とプロンプトを約24万枚のデータセッ

                                                AIで画像の美しさを評価する LAION Aesthetics - A Day in the Life
                                              • 日本語LLMでLLaVAの学習を行ってみた - Qiita

                                                はじめに 本記事はLLM Advent Calendar 2023 2日目の記事になります。 最近、様々なLLMが発表されたことによりローカルLLM界隈では自作データセットを作成して自分好みのLLMを作成するなど日本語LLM界隈は盛り上がりを見せています。 一方、マルチモーダルなLLMとして画像を組み合わせたものに関してはTuring、Stability AI、Rinnaなどの企業ではモデルを公開していますが、個人で行われている方は少ないという印象があります。 そこで今回はLLaVAと同じ方法で日本語LLMを学習させて、個人でマルチモーダルなLLMの学習を行ってみました。個人で学習できる範疇ということで学習はRTX4090 1台で行っています。 学習に使用したコードは以下で公開しています。 モデルは以下で公開しています。 事前学習に使用した日本語翻訳データセットは以下で公開しています。 L

                                                  日本語LLMでLLaVAの学習を行ってみた - Qiita
                                                • Droid くんはどこ? Dlib で手軽に物体検出しよう!

                                                  こんにちは。アプリケーション共同開発部エンジニアの石島です。 昨年の 11 月に Keras を使って Droid くんを認識してみた と題して Deep Learning の一種である Convolutional Neural Network(CNN)を用いて画像内の Droid くんの認識を行なってみました。今回は画像中の Droid くんを探してみようと思います! 今回は Droid くんのみの検出なので大量の画像と学習時間を必要とする Deep Learning ではなく、以前からある画像特徴量の HOG(Histograms of Oriented Gradients)特徴量と機械学習手法の SVM(Support Vector Machine)を用いて Droid くんの検出を行います。 この組み合わせは Deep Learning の登場前にはよく用いられていた手法です。こち

                                                    Droid くんはどこ? Dlib で手軽に物体検出しよう!
                                                  • FaceNetによる顔画像の特徴量抽出 - アイドル画像による検証 - - myaun’s blog

                                                    1. はじめに 参考 2. FaceNetによる顔画像の特徴量抽出 2-1. ブログ画像を収集 2-2. ブログ画像から顔検出、保存 2-3. Facenetにより顔画像から特徴量抽出 2-4. 得られた顔画像特徴量の検証 A. 類似顔画像検索 B. t-SNEによる2次元可視化 C. クラスタリング 3. 終わりに 1. はじめに 本記事では、アイドルブログの画像から検出された顔画像からFaceNetによる特徴量を抽出しました。 そして、得られた特徴量の表現力や挙動を確認しました。 この検証は、ブログやSNSなどのメディアで、気になるメンバ以外の投稿に気になるメンバが出現したときに検出したいと思うことがあり、そのための1歩目の実験です。 ラベル付けをする根性が無いので、自動ラベル付け or 1枚だけ(プロフィール画像など)から学習するOne-shot learning (or Few-s

                                                      FaceNetによる顔画像の特徴量抽出 - アイドル画像による検証 - - myaun’s blog
                                                    • AIスタートアップ「GAUSS」、AIの画像解析を活用したファッションEC販売向けのタグ付け業務効率化システムのサービス提供に向けた先行予約を開始します。

                                                      AIスタートアップ「GAUSS」、AIの画像解析を活用したファッションEC販売向けのタグ付け業務効率化システムのサービス提供に向けた先行予約を開始します。 株式会社GAUSS(本社:東京都渋谷区、代表取締役:宇都宮 綱紀、以下「GAUSS」)は、画像および自然言語を人工知能(AI)活用して解析し、類似の商品画像から自動的に最適なタグを抽出および付与するシステム「ATS」(Auto Tagging System)の販売を2018年4月より開始いたします。 当システムは2017年10月末より共同開発先の株式会社ANAP及びANAPの子会社である株式会社ATLAB(以下、「ANAP」と「ATLAB」を総称して「ANAP」)が運営する「ANAPオンラインショップ」で試験運用を開始しています。 [開発したサービスについて] https://prtimes.jp/main/html/rd/p/0000

                                                        AIスタートアップ「GAUSS」、AIの画像解析を活用したファッションEC販売向けのタグ付け業務効率化システムのサービス提供に向けた先行予約を開始します。
                                                      • 09bdd7229713c0a6b090

                                                        はじめに 「この人の名前を知りたい」という場合、トレーニング画像としてとして、一人あたり複数枚の画像があれば、一般物体識別としてVGGやAlexNetやResNetなどの識別モデルが適用できそうです。例えば、すぎゃーん氏のアイドル顔画像識別が有名です。 ですが、トレーニング画像を集めるのは大変です。 想定するタスクによっては、1人あたり1枚くらいしか学習・識別に利用できる画像がないという場合もあります。 また、「2つの顔が同じかどうか調べたい」「ある顔と似ている顔を検索したい」「似ている顔を分類したい」といったときには、識別モデルの適用ではなく別の手法を取る必要があります。 手法としては、以下が考えられます。 識別モデルの中間層の出力を利用する方法 GoogleのFaceNetをベースとしたOpenfaceやdavidsandberg/FaceNetなどの学習済みモデルを利用する Micr

                                                          09bdd7229713c0a6b090
                                                        • iOS11のVision.frameworkを使ってみる - Qiita

                                                          iOS11から追加された、Vision.frameworkを使ってみた時に調べた内容のメモです。 機械学習の簡単な概要にも触れつつ、Visionを用いたカメラ画像を判別するサンプルアプリを作成します。 サンプルアプリ Visionの「機械学習による画像分析」機能を利用して、以下のサンプルアプリをつくります。 このサンプルアプリは、カメラで映した画像を判別し、モノの名前を表示します。 デモ動画 Vision.frameworkとは iOS11から追加された画像認識APIを提供するフレームワーク 同じくiOS11から追加された機械学習フレームワークのCore MLを抽象化 機械学習スタック iOSの機械学習フレームワークを利用したアプリケーションスタックは以下のような図になります。 補足:ニューラルネットワークとは 機械学習手法の一種 人間の脳の神経回路網を 数式モデルで表したもの NNと略さ

                                                            iOS11のVision.frameworkを使ってみる - Qiita
                                                          • 画像の認識・理解シンポジウムMIRU2018に参加してきました - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

                                                            研究開発部署 Dwango Media Village部の佐々木です。 Dwango Media Villageは8月に行われた「第21回 画像の認識・理解シンポジウム」MIRU2018で2日間企業展示を行いました。 MIRU2018は国内のComputer Vision研究者たちの学術交流のためのシンポジウムです。 会期と並行して若手の会プログラムという企画も開催されていました。 このプログラムは学生・ポスドク・社会人を問わず若手の研究者たちの交流の場でした。 この記事ではシンポジウムの内容に加えて若手企画の様子も紹介したいと思います。 Dwango Media VillageはMIRU2018企業ブースでポスターとデモ展示を行いました。 ポスターでは漫画ページの自動着色、線画からの法線マップ推定、画像特徴量などの大量かつ多次元ベクトルの高速クラスタリングなどのComputer Visi

                                                              画像の認識・理解シンポジウムMIRU2018に参加してきました - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
                                                            • 博士論文 背景雑音と話者の違いに頑健な 音声認識 2013年1月28日 指導教員 峯松 信明 教授 電気系工学専攻 37-107091 鈴木 雅之 あらまし 音声認識は様々なシステムの要素技術として利用されて

                                                              博士論文 背景雑音と話者の違いに頑健な 音声認識 2013年1月28日 指導教員 峯松 信明 教授 電気系工学専攻 37-107091 鈴木 雅之 あらまし 音声認識は様々なシステムの要素技術として利用されている.例えば,カーナビシステ ム,スマートフォンの音声対話システム,企業のコールセンタにおける電話自動応対シス テムなど,その応用範囲は多岐に渡る.音声認識の精度を高めることは,これらのシステ ムのユーザ満足度を向上させることに直結する.そのため,音声認識の精度を向上させる ために研究を進めていくことが重要である. 音声認識の精度は,様々な要因によって低下してしまうことが知られている.例えば背 景雑音が音声に重畳してしまった場合,何も対処を行わないと音声認識精度は大幅に低下 してしまう.他にも,話者の違い,マイクとの距離,部屋の残響,話している内容と,様々 な要因によって音声認識精度

                                                              • 知っておきたいキーワード | 映像情報メディア学会

                                                                NeRF: Neural Radiance Fields(ニューラルラディアンスフィールド) 2024年09月号掲載 MLOps 〜ML技術の発展とMLOpsの変遷〜 2024年05月号掲載 メタサーフェス 2024年03月号掲載 言語系生成AI 2024年01月号掲載 ハイパーパラメータ最適化 2023年11月号掲載 魅力とかわいさ 2023年07月号掲載 マテリアルズ・インフォマティクス 2023年05月号掲載 NPR: Non-Photorealistic Rendering(非写実的レンダリング) 2023年03月号掲載 End2End 2023年01月号掲載 LiDARとその特徴 2022年11月号掲載 ボリュメトリックキャプチャ 2022年09月号掲載 質感の知覚 2022年07月号掲載 VRM 2022年05月号掲載 IRS(Intelligent Reflecting Su

                                                                • 数百万件の画像データを1秒以内で画像検索する技術——日立製作所 | RBB TODAY

                                                                  日立製作所は、7月24日、数百万件の大規模な画像・映像データの中から、指定した画像と類似した画像を1秒以内で高速検索できる類似画像検索技術を開発したと発表した。 類似画像検索技術は「見た目が似ている」画像を検索する技術で、画像の色の分布や形状等、画像自体が持つ情報を自動的に抽出し、高次元(今回の技術では100次元)の数値情報として表現した「画像特徴量」に基づいて行われる。この技術自体はすでに実用化されているが、膨大な計算量が問題となっていた。 日立の開発した技術は、画像データを保存する時に、類似したデータ同士をまとめ、その特徴量の平均をメモリ上に保管する「クラスタリング処理」と、画像特徴量のデータをハードディスクに保存する際の記録場所の最適化を行うことにより、高速かつメモリ消費量を抑えた検索を可能にしたという。 この技術を応用すれば、10,000時間分の映像の中から、好きな芸能人が出ている

                                                                    数百万件の画像データを1秒以内で画像検索する技術——日立製作所 | RBB TODAY
                                                                  • MIRU2024参加レポート ~アダコテックの技術と外観検査のインターンを紹介しました~ - アダコテック技術ブログ

                                                                    画像に関する国内会議であるMIRU2024にシルバースポンサーとして参加しましたので、ご報告します。われわれの技術紹介を行うとともに、画像の研究を行っている学生に向けてアダコテックでのインターンのご紹介をしました。 MIRUとは MIRUは、情報処理学会コンピュータビジョンとイメージメディア(CVIM)研究会が主催する画像の認識・理解シンポジウムです。毎年夏に開催されており、画像に関する技術研究の国内最大の会議です。 今年は熊本城ホールにて8月6日から8月9日の日程で行われました。年々参加者数が増加しており、今年も1,500名以上の方が参加し、600件以上の発表が行われました。来年は京都国際会館で2025年7月29日から8月1日に開催されます。 展示内容 今回の展示内容は、人工知能学会の展示と同様に、HLACを用いた外観検査プロダクトに関するものでした。アダコテックでは、工場のような制約の

                                                                      MIRU2024参加レポート ~アダコテックの技術と外観検査のインターンを紹介しました~ - アダコテック技術ブログ
                                                                    • モーダル依存のないトランスフォーマー:Perceiver Model

                                                                      3つの要点 ✔️ 複数のタスクで優れた性能を発揮するクロスモーダルなトランスフォーマーベース ✔️ 100,000入力以上のシーケンスを処理する能力を有する ✔️ ImageNet、AudioSet、ModelNet-40のSOTAモデルと同等以上の性能を発揮 Perceiver: General Perception with Iterative Attention written by Andrew Jaegle, Felix Gimeno, Andrew Brock, Andrew Zisserman, Oriol Vinyals, Joao Carreira (Submitted on 4 Mar 2021) Comments: Published on arxiv. Subjects:  Computer Vision and Pattern Recognition (cs.CV

                                                                        モーダル依存のないトランスフォーマー:Perceiver Model
                                                                      • OpenCV.js をちょっとだけ試してみた。 - Qiita

                                                                        この記事はOpenCV Advent Calendar 2017の23日目の記事です。他の記事は目次にまとめられています。 この話のオチ Web上でアプリケーションを開発するツール・ライブラリもいろいろありますが、JavaScriptで動作する画像解析ライブラリとしてOpenCVが活用できるようになりました! 単純な色変換のみならず、Webカメラからの入力・表示をはじめとして、様々な機能が使えるようになっています。 2018年は、もっと身近に、コンピュータビジョンが使える時代になりそうですね! はじめに OpenCVアプリケーションを作るときの課題の1つに、ポータビリティがあります。GUIとして共通化できるhighguiモジュールがあってもWindows, MacOS, Android, iOS それぞれのプラットフォームで動かすためには、それなりの苦労が必要。多様なクライアントに対応する

                                                                          OpenCV.js をちょっとだけ試してみた。 - Qiita
                                                                        • Kaggle-Shopee コンペの振り返りとソリューション

                                                                          Kaggle-Shopee コンペの振り返り 2021/03/09~2021/05/11まで開催していたShopee コンペの振り返りになります. 2週間程度しか手を動かせなかったですが,久しぶりに参加したので備忘録として記録を残しておきます.最終的な結果は179th/2464で銅メダルで,特に凝ったことは何もしていなかったので,妥当かなと思います.このコンペは上位10チーム中7チームが日本人チームで,日本人のレベルの高さを改めて実感できるコンペでした! 概要 コンペの内容は簡単に言うと,画像とテキスト情報を用いて、2つの画像の類似性を比較し,どのアイテムが同じ商品であるかを予測するコンペになります. 開催期間: 2021/03/09 ~ 2021/05/11 参加チーム数: 2464 予測対象: posting_id 列にマッチする全ての posting_id を予測する.ただし,pos

                                                                            Kaggle-Shopee コンペの振り返りとソリューション
                                                                          • Microsoft PowerPoint - pr_12_template-bs.pptx

                                                                            デジタル情報の処理と認識 (2012a) 第12回 パターン検出と画像特徴 1  テンプレートマッチング  領域分割  画像特徴 12回 パターン検出と画像特徴 テンプレート マッチング デジタル情報の処理と認識 (2012a) 第12回 パターン検出と画像特徴 2 テンプレートマッチング  テンプレートと呼ばれる小さな一部の画像領域と 同じパターンが画像全体の中に存在するかどうか を調べる方法  画像内にある対象物体の位置検出、物体数のカウント、 物体移動の検出などに使われる  Template Matching (図形・画像などの)型 照合 テンプレートマッチングの計算  テンプレートを画像の中で順番に移動させながら、 テンプレートとテンプレートに重なる部分の 画像の類似度を計算していく テンプレート 画像  SSD (Sum of Squared Difference

                                                                            • 画像認識とは-機能・事例・仕組み・導入方法など徹底解説 | AI専門ニュースメディア AINOW

                                                                              AI(人工知能)の話題が連日のようにニュースに登場するようになりました。富士キメラ総研の「2020 人工知能ビジネス調査」によると、2020年度の国内AIビジネス市場規模は、前年度比15.4%増の1兆1084億円に拡大すると見込まれています。また、2021年度以降はDX(デ... 画像認識の活用事例 画像認識技術といっても、画像の種類によって対象の形状や色、複雑さ、データの数などが違ってきます。そのため扱う画像データによって技術領域を分けることができ、主に以下の5つがあります。 物体認識 顔認識 文字認識 物体検出 画像キャプション生成 順番に解説していきます。 物体認識 まず1つ目が物体認識です。物体認識とは、特定の物体と同一のものが画像中に存在するか検証するときや、画像に映っている物体のカテゴリを見分けるなど、画像に含まれている物体の情報を抽出する技術です。この技術は様々な分野で利用さ

                                                                                画像認識とは-機能・事例・仕組み・導入方法など徹底解説 | AI専門ニュースメディア AINOW
                                                                              • ヤフーの類似画像検索技術と特徴量モデル 〜 Yahoo!ショッピングの事例紹介 #機械学習

                                                                                ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。ヤフーで画像認識技術の研究開発を担当している西村と田中です。 Yahoo!ショッピング(iPhoneアプリ)では昨年7月から一部カテゴリーを対象に、類似画像検索機能が利用可能になっています。また、昨年9月にはYahoo!ラボから類似画像検索技術を用いたラボアプリFavNaviをリリースしました。 この2つのアプリに関しては、Yahoo! JAPAN Tech Blogで記事が公開されています。 似た商品が見つかる! Yahoo!ショッピングの類似画像検索 〜 近傍探索NGTの導入事例 流行アイテムを探してみよう。AIを使ったファッション画像検索アプリ ヤフーでは、これらのサービスで使われている類似画像検索の技術を独自に

                                                                                  ヤフーの類似画像検索技術と特徴量モデル 〜 Yahoo!ショッピングの事例紹介 #機械学習
                                                                                • プロンプトの推定をDALL·E 3とGPT-4Vにまかせた! - ABEJA Tech Blog

                                                                                  目次 はじめに DALL·E 3とGPT-4Vにまかせる 実装 実験結果 定量評価 その他 さいごに はじめに この記事はABEJAアドベントカレンダー2023の2日目の記事です。 こんにちは。データサイエンティストの小林です。12月に入り、クリスマスももうすぐですね。 私は一年中、Spotifyの"Christmas Hits!"を聞くくらいにクリスマスソングが大好きです! アドベントカレンダー用にクリスマスっぽいサムネを作ろうかなと思い、早速ChatGPTに作ってもらっていたのですが、画像生成のプロンプト調整結構難しいですよね。。 ネットで流れてくる他の人の作った画像、どんなプロンプトで作ったんだろう?とが気になることが結構あります。 そこで今回は、先月公開されたGPT-4 with Vision(GPT-4V)のAPIを用いて、DALL·E 3への画像生成プロンプトを自動で推定・修正

                                                                                    プロンプトの推定をDALL·E 3とGPT-4Vにまかせた! - ABEJA Tech Blog