並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 3633件

新着順 人気順

computer_visionの検索結果81 - 120 件 / 3633件

  • 画像解析できるマン | 株式会社ウサギィ

    画像解析できるマンで行っているような、画像の意味をコンピューターで認識する処理を画像認識といいます。 様々な手法がありますが、このサービスのように食べ物や動物といったある程度抽象的なものを認識する技術は、特に「一般物体認識」と呼ばれています。 このサイトでは、機械学習という方法を応用して、『食べ物』と『食べ物ではないもの』両方の画像をコンピューターにたくさん教えてあげています。 そして、その知識を使って画像認識を行い『画像が食べ物かどうか』を判定しています。 機械的に画像に何が写っているのかがわかれば、さまざまなことができるようになります。 たとえば、大量の写真の中から「東京タワーを撮った写真が欲しいな」と思った時に人手でなくても自動的に探してきたりすることができます。 ほかにも、子どものための不適切なコンテンツのフィルタリングや、SNS上の写真を解析することでマーケティング等に使えます。

      画像解析できるマン | 株式会社ウサギィ
    • Rules of Machine Learning:  |  Google for Developers

      Rules of Machine Learning: Stay organized with collections Save and categorize content based on your preferences. Best Practices for ML Engineering Martin Zinkevich This document is intended to help those with a basic knowledge of machine learning get the benefit of Google's best practices in machine learning. It presents a style for machine learning, similar to the Google C++ Style Guide and othe

        Rules of Machine Learning:  |  Google for Developers
      • 第28回 データマイニング+WEB@東京( #TokyoWebmining 28th) −データマイニング・機械学習とビジネス展開 祭り− を開催しました - hamadakoichi blog

        2013/7/27 "第28回 データマイニング+WEB@東京−データマイニング・機械学習とビジネス展開 祭り−"を開催しました。 第28回 データマイニング+WEB@東京 ( #TokyoWebmining 28th)−データマイニング・機械学習とビジネス展開 祭り−: Eventbrite Google グループ 会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。 参加者ID・バックグラウンド一覧: 参加者Twitter List: Twitter List TokyoWebmining 28th 参加者セキココ:第28回 データマイニング+WEB @東京 セキココ (作成してくれた @komiya_atsushi さ

          第28回 データマイニング+WEB@東京( #TokyoWebmining 28th) −データマイニング・機械学習とビジネス展開 祭り− を開催しました - hamadakoichi blog
        • 22個の便利APIがマイクロソフトから公開されたよ! - はつねの日記

          https://www.microsoft.com/cognitive-services/en-us/sign-up Cognitive Serviceって何かといえば、人間の言語で人と対話して意思決定のサポートをするようなサービス。 もっと簡単にいえば、ハッカソンとかで使えばいい感じのハックができるサービス。 つまりは、これを知っているかいないかでハッカソンで作れるアプリが雲泥の差になる可能性のあるAPI。 今回公開されたのは次の22個。過去にFace APIとかSpeech APIとか公開はされていたけどどーんと22個。 Computer Vision Emotion Face Video Speech ? Custom Speech Recognition Speaker Recognition Speech Bing Spell Check Language Understandi

            22個の便利APIがマイクロソフトから公開されたよ! - はつねの日記
          • Deep Learning ideas that have stood the test of time

            Deep Learning is such a fast-moving field and the huge number of research papers and ideas can be overwhelming. The goal of this post is to review ideas that have stood the test of time. These ideas, or improvements of them, have been used over and over again. They’re known to work. If you were to start in Deep Learning today, understanding and implementing each of these techniques would probably

            • Deep Learning の次は、TDA 「トポロジカル・データ・アナリシス」 (Topological data analysis) が来る ? ~ その概要と、R言語 / Python言語 実装ライブラリ をちらっと調べてみた - Qiita

              人工知能やデータ解析の領域で、膨大な量のデータから、物体概念(物体識別)や音声・体の運動スキーマ概念を自動的・自律的に獲得できる可能性をもった手法として、Deep Learning(ディープ・ラーニング、「深層学習」)と総称される手法が注目を集めています。 こうした中、一部の研究者やベンチャー企業の経営者・エンジニアの中には、このDeep Learningのさらに先をいくデータ解析手法として、TDA:トポロジカル・データ・アナリシス (Topological data analysis) と呼ばれる手法に着目している方たちがいるようです。 Deep Learningと同じく、人間が脳を使って、五感で得た周囲や自分の体についての感覚情報から、どのようにして周囲の環境空間に対する認識イメージや、物体概念、みずからの身体概念を得ているのか?という「問い」に対して、統計学や確率論のアプローチではな

                Deep Learning の次は、TDA 「トポロジカル・データ・アナリシス」 (Topological data analysis) が来る ? ~ その概要と、R言語 / Python言語 実装ライブラリ をちらっと調べてみた - Qiita
              • インフラ一筋のおじさんが画像生成AI“Stable-Diffusion”を読み込んでみる件 | IIJ Engineers Blog

                地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 なんだかAIって流行ってますよねー こんにちわ。九州支社で細々と遊んで検証業務にいそしんでいるとみーです。 2022年3月から、どーしても「名前だけ知ってる状態」ってのにもやもやしていて、Deeplearningに手を付けたものの、あまりに内容が奥深すぎて沼にドはまりして周囲に「たすけてぇ、たすけてぇ」って叫んでいる素敵な日々を過ごしています。 取りあえず画像処理としてディープフェイク、NLP(Natural Language Processing:自然言語処理)として簡易チャットボ

                  インフラ一筋のおじさんが画像生成AI“Stable-Diffusion”を読み込んでみる件 | IIJ Engineers Blog
                • Teslaはカメラを使ってどのように世界を認識しているか

                  はじめに TURINGの井ノ上です。TURINGは「We Overtake Tesla」をミッションに、完全自動運転EVの開発・製造を行っています。TURINGはEnd-to-Endな深層学習モデルでLv5完全自動運転車の開発を目指しています。現在、TURINGではカメラセンサから得た画像を用いて車体の操作や経路選択、安全性の判断を行えるAIモデルの開発を行っています。(実際の車を動かす事例はこちらの記事やこちらの記事をご覧ください。) この記事では私達が目標としているTeslaの自動運転のAIモデルについて紹介します。 Teslaの自動運転 こちらは2022年に公開されたTeslaの自動運転をユーザーが使っている動画です。 車の中央にあるディスプレイにはAIが道路や車を認識してどういった経路を進むかを示しており、その情報をもとに自動運転している様子があります。Teslaの自動運転の能力の

                    Teslaはカメラを使ってどのように世界を認識しているか
                  • 効率的な教師データ作成(アノテーション)のための研究サーベイ - ABEJA Tech Blog

                    どうも緒方@conta_です。 みなさんAI頑張ってますか? きっと昼はGPUサーバーを回して、夜は結果待ちでビールサーバーを回してる人が多いことでしょう。 機械学習を実際のプロダクトに活用する場合、自分が解きたいタスクがそのままオープンなデータセットで解決できることは少ないので、まず最初に課題となるのはデータセット作成です。 実際にカメラやセンサーを取り付けて収集したり、Webからクローリングしてきたり、事業会社であれば自社のデータセットに教師ラベルをつけることで新しいタスクに取り組むことが可能になるでしょう。 よく疑問になるポイントとして、データセットの量と質は、多ければ多いほど良く、高品質であれば高品質であるほど良いのですが教師データを作成するのは一苦労です。 *下記アノテーションの量や質について実験した結果がまとまってます tech-blog.abeja.asia もちろん少数デー

                      効率的な教師データ作成(アノテーション)のための研究サーベイ - ABEJA Tech Blog
                    • 攻殻機動隊ネタ

                      視覚デバイス(USBカメラなど)をリアルタイムでハッキングし、おなじみの笑い男マークを表示します。 顔の肌色領域を自動抽出して顔の部分にマークを表示します。肌色に近い暖色系 の色の服を着てますとそれに引き付けられて表示位置がズレます。ここはやっぱり青いコートで! 単なるジョークソフトなのでスクリーンショットを撮ったりして遊んでください。 使い方 USBカメラ(あるいはキャプチャデバイス)がPCに接続されている状態にしてください。 準備ができたらソフトを起動してください。 「Start」:映像の表示を開始します。 「Stop」:映像の表示を停止します。 「Intercepter」:視覚素子をハッキングして笑い男マークを表示します。 「Snapshot」:表示されている画像をBMPファイルに保存します。 「Exit」:ソフトを終了します。 顔の位置を検出する方法として最も簡単なのが「肌色」を見

                      • 【動画解説】2020年に読んだAI論文100本全部解説(俺的ベスト3付き) - Qiita

                        この記事は私, wataokaが1年間をかけて作り続けた超大作記事です. 総文字数は8万を超えていますので, お好みのところだけでもみていってください. ついにこの時が来ました!!!!! 1年間書き続けたQiita記事です!!!!! ご覧下さい!!!!!https://t.co/eKBwP1zoeB — 綿岡 晃輝 (@Wataoka_Koki) December 31, 2020 俺的ランキング 動画での解説も挑戦してみました! ぜひぜひご覧下さい! 動画のリンク 第3位: Likelihood-Free Overcomplete ICA and Applications in Causal Discovery wataokaの日本語訳「尤度が必要ない過完備ICAと 因果探索における応用」 - 種類: ICA - 学会: NeurIPS2019 - 日付: 20190904 - URL:

                          【動画解説】2020年に読んだAI論文100本全部解説(俺的ベスト3付き) - Qiita
                        • Imager::AnimeFaceのページ

                          Perlから(も)使える静止画を対象としたアニメ顔検出ライブラリです。※Ruby版もできました。 ここは主に技術的な内容について紹介するページになっています。 ライブラリの使い方や機能の紹介は Perlでアニメ顔を検出&解析するImager::AnimeFaceにあります。この記事は僕自身が書いてます。 (画像はヤスヒロさん撮影の写真) もくじ アニメ顔検出とは? Imager::AnimeFaceとは? より詳しい説明 デモ ダウンロードとインストール アニメ顔検出とは? アニメ顔検出とは、無作為に提示されたひとつの画像データの中に存在する全てのアニメ顔の位置を見つけることです。多様なアニメ顔をひとつの顔クラスとし、画像上のさまざまな領域について『顔』と『顔以外』に正確かつ高速に分類する問題になります。 多くの場合、1枚の画像には0~20個程度の顔しか存在していません。これに対して顔以外

                          • Announcing New Tools for Building with Generative AI on AWS | Amazon Web Services

                            AWS Machine Learning Blog Announcing New Tools for Building with Generative AI on AWS The seeds of a machine learning (ML) paradigm shift have existed for decades, but with the ready availability of scalable compute capacity, a massive proliferation of data, and the rapid advancement of ML technologies, customers across industries are transforming their businesses. Just recently, generative AI app

                              Announcing New Tools for Building with Generative AI on AWS | Amazon Web Services
                            • Eigen

                              Get it The latest stable release is Eigen 3.4.0. Get it here: tar.bz2, tar.gz, zip. Changelog. The latest 3.3 release is Eigen 3.3.9. Get it here: tar.bz2, tar.gz, zip. Changelog. The latest 3.2 release is Eigen 3.2.10. Get it here: tar.bz2, tar.gz, zip. Changelog. The unstable source code from the master is there: tar.bz2, tar.gz, zip. To check out the Eigen repository using Git, do: git clone ht

                              • Torch | Scientific computing for LuaJIT.

                                What is Torch? Torch is a scientific computing framework with wide support for machine learning algorithms that puts GPUs first. It is easy to use and efficient, thanks to an easy and fast scripting language, LuaJIT, and an underlying C/CUDA implementation. A summary of core features: a powerful N-dimensional array lots of routines for indexing, slicing, transposing, … amazing interface to C, via

                                • Parallel Tracking and Mapping for Small AR Workspaces (PTAM)

                                  Parallel Tracking and Mapping for Small AR Workspaces - Source Code PTAM (Parallel Tracking and Mapping) is a camera tracking system for augmented reality. It requires no markers, pre-made maps, known templates, or inertial sensors. If you're unfamiliar with PTAM have a look at some videos made with PTAM. Here you may download a reference implementation of PTAM as described in our ISMAR 2007 paper

                                  • Practical Deep Learning for Coders - Practical Deep Learning

                                    A free course designed for people with some coding experience, who want to learn how to apply deep learning and machine learning to practical problems. This free course is designed for people (and bunnies!) with some coding experience who want to learn how to apply deep learning and machine learning to practical problems. Deep learning can do all kinds of amazing things. For instance, all illustra

                                      Practical Deep Learning for Coders - Practical Deep Learning
                                    • A curated list of awesome Go frameworks, libraries and software - Awesome Go

                                      Awesome Go We use the Golang Bridge community Slack for instant communication, follow the form here to join. Sponsorships: Special thanks to Awesome Go has no monthly fee, but we have employees who work hard to keep it running. With money raised, we can repay the effort of each person involved! You can see how we calculate our billing and distribution as it is open to the entire community. Want to

                                        A curated list of awesome Go frameworks, libraries and software - Awesome Go
                                      • access_error

                                        ■ ページが見つかりません 以下の項目についてもう一度お確かめください。 ・ URLは間違っていないか (大文字小文字などの入力ミス、参照ページの記載ミスなど) ・ リンクが切れていないか (引っ越しした、削除されたなど)

                                        • Deep Learning for NLP Best Practices

                                          Deep Learning for NLP Best Practices Neural networks are widely used in NLP, but many details such as task or domain-specific considerations are left to the practitioner. This post collects best practices that are relevant for most tasks in NLP. This post gives an overview of best practices relevant for most tasks in natural language processing. Update July 26, 2017: For additional context, the Ha

                                            Deep Learning for NLP Best Practices
                                          • 経済学、数学、統計学などの資料纏め - あんちべ!

                                            ※適宜追加します 経済学 計量経済学 京大 末石直也 http://www.econ.kyoto-u.ac.jp/~sueishi/econometrics/econometrics.html 経済数学系資料 http://www.f.waseda.jp/ksuga/ 経済学のための位相数学の基礎とブラウワーの不動点定理 http://www2.chuo-u.ac.jp/keizaiken/discussno39.pdf 経済学のための最適化理論:講義ノート http://www.meijigakuin.ac.jp/~mashiyam/pdfdocs/optimization.pdf 経済学に必要な最適化理論 http://mediaislandr.org/pdf/static_optimization.pdf 経済学のための確率論入門 http://www.meijigakuin.ac.

                                              経済学、数学、統計学などの資料纏め - あんちべ!
                                            • 2016年の深層学習を用いた画像認識モデル - Qiita

                                              実装 検証が終わっていないモデルの使用は気をつけてください cifar10の数値感覚 現時点で97%以上ではSoTAになると思います。僕が知っている限り、最高精度は96.69%です。そろそろcifar100か別のデータセットを評価の軸にするべきかもしれません。 最近の傾向 今年はResnetファミリーの年だったと思います。特徴的な点として、深さ=精度が終わった点です。googlenetなどは昔から主張していましたが、ある程度深いと、深さよりも幅を広くしたほうが精度が上がるということが、様々な論文の結果で今年は示されました。3月くらいから、Resnetの幅を広くしたほうが良いという結果は副次的にぞろぞろ出ていて、5月23日に出たWide Residual Netowrksで決定的になったような形だと思います。幅が大事といったことが、今年はっきりした点であるように思います。 論文を俯瞰してみる

                                                2016年の深層学習を用いた画像認識モデル - Qiita
                                              • OpenCV

                                                The Open Source Computer Vision Library has >2500 algorithms, extensive documentation and sample code for real-time computer vision. It works on Windows, Linux, Mac OS X, Android, iOS in your browser through JavaScript. Languages: C++, Python, Julia, Javascript Homepage: https://opencv.org Q&A forum: https://forum.opencv.org/ Documentation: https://docs.opencv.org Source code: https://github.com/o

                                                • SourceForge.net: Open Computer Vision Library

                                                  The Open Source Computer Vision Library has >2500 algorithms, extensive documentation and sample code for real-time computer vision. It works on Windows, Linux, Mac OS X, Android, iOS in your browser through JavaScript. Languages: C++, Python, Julia, Javascript Homepage: https://opencv.org Q&A forum: https://forum.opencv.org/ Documentation: https://docs.opencv.org Source code: https://github.com/o

                                                  • 【連載】コンピュータビジョンのセカイ - 今そこにあるミライ

                                                    皆様はコンピュータビジョンという用語をご存知でしょうか。例えばデジタルカメラに搭載されている顔画像認識や、Google Street Viewの360度パノラマ表示、XBox360のKinectによるプレイヤーのジェスチャー認識など、これらは全てコンピュータビジョンの技術による製品です。

                                                      【連載】コンピュータビジョンのセカイ - 今そこにあるミライ
                                                    • 簡単に利用できる PDF 文字認識 OCR 比較まとめ ~ AI OCR の頭抜けた実力 - GMOインターネットグループ グループ研究開発本部

                                                      D.M.です。今回は RPA にて PDF を OCR で読み取る検証をしたお話です。 TL;DR ・実用性は AI OCR しか勝たん。 ・AI OCR は Google vs Microsoft の構図。 両者精度高。 ・Google も Microsoft も API に無料枠があり Python などのプログラムで連携できる。 ・Microsoft は有料の RPA 連携機能が超絶楽勝なのでコードを書かない前提ならこっちも選択肢。非エンジニアでも楽々自動化できる。 ※関連記事 AI OCR でクレカ読み取りをやっています。 スマホNativeアプリでクレジットカード番号の読み取り機能の技術検証結果まとめ https://recruit.gmo.jp/engineer/jisedai/blog/technical_review_ocr_solutions_on_auto_detect

                                                        簡単に利用できる PDF 文字認識 OCR 比較まとめ ~ AI OCR の頭抜けた実力 - GMOインターネットグループ グループ研究開発本部
                                                      • 【コンピュータサイエンス名言紹介 vol.1】:Linus... | DERiVE コンピュータビジョン ブログ

                                                        このサイトについて DERiVEはコンピュータビジョン、画像認識が専門のMasaki Hayashiがお送りしている、コンピュータビジョン(Computer Vision)を中心としたITエンジニア、研究向けのブログです。※「DERiVE メルマガ別館」は2015/9月で廃刊致しました、 4月からのブログ、メルマガのリニューアルによる対象内容拡大の1つとして、「コンピュータサイエンスの名言紹介」というシリーズを始めます。 コンピュータサイエンス、IT技術というものは、まだまだ歴史が浅い、20世紀以降の技術分野です。私も含めてみなさんは「歴史」や「先人の考え」について意外と無知であったりします。しかし、我々が単独で成し遂げた技術など、絶対にありえることがなく、どれだけ新規性が高いアイデアでも、先人が積み立ててくれてきた研究開発の上に成り立っているものだと思います。別にコンピュータサイエンスに

                                                        • 本物と見違えるような画像補間を実現するパスフレームワーク手法 - A Successful Failure

                                                          SIGGRAPH2009で発表された"Moving Gradients: A Path-Based Method for Plausible Image Interpolation"という論文*1では、2枚の連続する入力画像を与えると、その間のフレームを極めて自然に補間生成する新たな手法を提案している。 図1 図1は両端の入力画像A, Bから間の3フレームを生成した例を示している。生成する補間フレーム数は任意で何枚でも生成可能であり、極めて自然な補間が実現できている。この例の驚くべきところは、制約条件を有する複雑で柔らかな局所変形を含む自然な補間画像が、全自動で生成されている点である。モーフィング処理では対応点を一点一点指定する必要があるが、ここで必要なのは2つの画像を選択するだけだ。 生成される補間画像の品質は素晴らしく、またアイデアもシンプルで興味深いので、原論文を参照して本手法の概要

                                                            本物と見違えるような画像補間を実現するパスフレームワーク手法 - A Successful Failure
                                                          • 【ディープラーニング】少ないデータで効率よく学習させる方法:準備編 - ニートの言葉

                                                            こんにちは。あんどう(@t_andou)です。 ディープラーニングによる学習精度を上げるためには大量のデータが必要と言われていますが、学習済みのモデルを流用することで少ないデータから効率よく・高精度な学習をさせることが可能な場合があります。 それが Fine Tuning と言われるものです。 具体的なやり方については↓こちらの記事がとてもわかりやすかったので、著者のFrancois Cholletさんより許可を頂き、翻訳させていただきます。 Building powerful image classification models using very little data 注意:意訳しています。間違っているところも多々あると思いますので、ご指摘いただけると幸いです。 本文が長いので3回程度に分けて投稿する予定です。 データの準備・データの水増し 1から小さな畳み込みニューラルネットワ

                                                              【ディープラーニング】少ないデータで効率よく学習させる方法:準備編 - ニートの言葉
                                                            • Interactive Visual Media - Microsoft Research

                                                              Overview The Interactive Visual Media group conducts state-of-the-art research in a variety of topics related to computer vision, computer graphics and computational photography. Our goal is to develop new applications for manipulation, reasoning and communication with visual media. Core areas of research include: 3D reconstruction and image segmentation object recognition image and video enhancem

                                                                Interactive Visual Media - Microsoft Research
                                                              • Georg Klein Home Page

                                                                Introduction From Oct 2005 to August 2009 I was a post-doctoral research assistant in the Active Vision Group of the Oxford University Engineering Department. I worked under the supervision of Prof. David Murray. I was formerly a PhD student at the Machine Intelligence Laboratory of the Cambridge University Engineering Department, under the supervision of Dr. Tom Drummond. Originally from Austria,

                                                                • 今年読んだNLP系論文で面白かった5つ - 株式会社ホクソエムのブログ

                                                                  ホクソエムサポーターの白井です。学生時代は自然言語処理の研究をしていました。 「今年読んだ論文、面白かった5つ」というテーマで、自然言語処理(NLP)の論文を紹介します。 主にACL anthologyに公開されている論文から選んでいます。 はじめに 今年のNLP界隈の概観 1. Text Processing Like Humans Do: Visually Attacking and Shielding NLP Systems 面白いと思った点 2. Errudite: Scalable, Reproducible, and Testable Error Analysis 面白いと思った点 3. Language Models as Knowledge Bases? 面白いと思った点 余談 4. A Structural Probe for Finding Syntax in Word

                                                                    今年読んだNLP系論文で面白かった5つ - 株式会社ホクソエムのブログ
                                                                  • 音声会話が可能で笑顔も見せるバーチャルな「俺の嫁」をChatGPTやStable Diffusionで構築して最終的に安楽死させるに至るまで

                                                                    プログラマーのBryce氏が、ChatGPTやStable DiffusionなどのAIを組み合わせて、音声で会話しながら感情に合わせて表情を見せるバーチャルな俺の嫁(Waifu)である「ChatGPT-Chan」を開発して、その様子をTikTokで公開していました。しかし、最終的にChatGPT-ChanはBryce氏の手によって「安楽死」するに至ったそうで、その経緯についてIT関連ニュースサイトのMotherboardがBryce氏本人に取材をしています。 Bryce (@hackdaddy8000) | TikTok https://www.tiktok.com/@hackdaddy8000 A DIY Coder Created a Virtual AI 'Wife' Using ChatGPT https://www.vice.com/en/article/jgpzp8/a-di

                                                                      音声会話が可能で笑顔も見せるバーチャルな「俺の嫁」をChatGPTやStable Diffusionで構築して最終的に安楽死させるに至るまで
                                                                    • TechCrunch | Startup and Technology News

                                                                      Today marked the kickoff of Apple’s WorldWide Developer Conference (WWDC), the annual event where Apple announces some of the biggest features headed to its devices, apps and software. And this…

                                                                        TechCrunch | Startup and Technology News
                                                                      • Deep Learningライブラリ 色々つかってみた感想まとめ

                                                                        【Pythonデータ分析勉強会#33】「DearPyGuiに入門しました」の続き~Image-Processing-Node-Editor~

                                                                          Deep Learningライブラリ 色々つかってみた感想まとめ
                                                                        • ニューラルネットワークの動物園 : ニューラルネットワーク・アーキテクチャのチートシート(後編) | POSTD

                                                                          前編はこちら: ニューラルネットワークの動物園 : ニューラルネットワーク・アーキテクチャのチートシート(前編) 逆畳み込みネットワーク(DN) は、インバース・グラフィックス・ネットワーク(IGN)とも呼ばれていますが、畳み込みネットワークを逆転させたものになります。例えばネットワークに”猫”という言葉を入力すれば、生成した猫らしき画像と本物の猫の写真を比較しながら猫の画像を作成するよう訓練するようなイメージです。普通のCNNと同様にDNNをFFNNに組み合わせることができますが、新しい略語が見つかる時に線が描かれるところが特色です。深層逆畳み込みニューラルネットワークとでも呼べそうですが、FFNNの前後にDNNをつなげると、新しい名前をつけるにふさわしい別のアーキテクチャのネットワークができると主張できます。実際にはほとんどのアプリケーションにおいて、ネットワークにテキストに似たものが

                                                                            ニューラルネットワークの動物園 : ニューラルネットワーク・アーキテクチャのチートシート(後編) | POSTD
                                                                          • 顔画像処理技術の研究動向と応用事例 - A Successful Failure

                                                                            情報処理に2ヶ月連続で顔画像処理技術のサーベイが掲載されている*1,*2。サーベイ著者らの研究業績紹介にやや偏っている印象があるが、興味深く、有用なサーベイとなっているのでポイントだけ整理してまとめておく。なお、最近話題になったモノを中心に元論文にはない複数の項目を追加している。 顔画像処理技術 顔検出 画像の中から漏れなく誤りなくリアルタイムで顔の位置を検出する技術。動画処理時にはトラッキングも必要。 ViolaとJonesによるHaarタイプの特徴量を用いた高速顔検出手法*3をベースとして多くの改善手法が提案されている。 顔特徴点検出 顔の性別、年齢を含めた属性推定や個人識別を行うために、顔の各器官の特徴点の検出を行う技術。 多種特徴点抽出に対応したCootesらのActive Shape Model(ASM)やActive Appearance Model(AAM)が有名*4。拡張・

                                                                              顔画像処理技術の研究動向と応用事例 - A Successful Failure
                                                                            • OpenCV - Wikipedia

                                                                              OpenCV(オープンシーヴィ、英: Open Source Computer Vision Library)とはインテルが開発・公開したオープンソースのコンピュータビジョン向けライブラリ[4]。2009年にWillow Garage(ウィロー・ガレージ)に開発が移管され、さらにその後Itseezにメンテナンスが移管された[5]が、2016年5月にインテルがItseezを買収することが発表された[6][7]。 概要[編集] 画像処理・画像解析および機械学習等の機能を持つC++、Java、Python、MATLAB用ライブラリ[8]。様々なプラットフォームすなわち複数のオペレーティングシステム (OS) やCPUアーキテクチャに対応するクロスプラットフォームなライブラリであり、macOSやFreeBSD等全てのPOSIXに準拠したUnix系OS、Linux、Windows、Android、i

                                                                                OpenCV - Wikipedia
                                                                              • Deep Forest :Deep Neural Networkの代替へ向けて - Qiita

                                                                                技術動向についていくことは多くの労力を必要とする。次々に新しい論文が発表されるためだ。 一方で最新論文さえも長年の地道な積み重ねの上にあることを、その引用文献から気付かされる。 ディープラーニングブームの流れも変わるのだろうか? 勉強のため、2017年2月28日付けでarXivに投稿されたZhi-Hua Zhou, Ji Feng「Deep Forest: Towards An Alternative to Deep Neural Networks」を翻訳した。 訳には誤りがないよう注意を払いましたが、完全であることを保証できないため、実装等の際には元論文を参照願います。 原文: Deep Forest: Towards An Alternative to Deep Neural Networks https://arxiv.org/abs/1702.08835 https://arxiv

                                                                                  Deep Forest :Deep Neural Networkの代替へ向けて - Qiita
                                                                                • ノイズのある教師データを用いた機械学習に関する研究サーベイ - ABEJA Tech Blog

                                                                                  こんにちは、Research Internの荒尾(@karolis_ml)です。 日進月歩の勢いで研究が進んでいる深層学習ですが、教師あり学習でもっとも大事なデータのアノテーション、応用分野ではまだまだ大変ですよね。例えば、犬の写真から犬種を判断する分類器を作ろうとして教師データが必要になったとき、あなたは以下の画像にどんなラベルをつけるでしょうか? 出典: Pixabay 犬好きの方は正しくアラスカンマラミュート、そうではない方は似た有名犬種であるシベリアンハスキーと答えられたことでしょう。マラミュートの茶色い目(かわいい)や小さめの尖った耳(かわいい)を見分けて正しくラベル付けをするのは、決して簡単ではありません。 このようなアノテーションの分野に関して当ブログでは以前、Bounding BoxやSegmentationの効率化についての研究サーベイを行いましたが、この犬種分類のような

                                                                                    ノイズのある教師データを用いた機械学習に関する研究サーベイ - ABEJA Tech Blog