「computer_vision」を検索 - はてなブックマーク

81 - 120 件 / 3633件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

computer_visionの検索結果81 - 120 件 / 3633件

画像解析できるマン | 株式会社ウサギィ
- 112 users
- usagee.co.jp
- テクノロジー
- 2015/05/19
画像解析できるマンで行っているような、画像の意味をコンピューターで認識する処理を画像認識といいます。様々な手法がありますが、このサービスのように食べ物や動物といったある程度抽象的なものを認識する技術は、特に「一般物体認識」と呼ばれています。このサイトでは、機械学習という方法を応用して、『食べ物』と『食べ物ではないもの』両方の画像をコンピューターにたくさん教えてあげています。そして、その知識を使って画像認識を行い『画像が食べ物かどうか』を判定しています。機械的に画像に何が写っているのかがわかれば、さまざまなことができるようになります。たとえば、大量の写真の中から「東京タワーを撮った写真が欲しいな」と思った時に人手でなくても自動的に探してきたりすることができます。ほかにも、子どものための不適切なコンテンツのフィルタリングや、SNS上の写真を解析することでマーケティング等に使えます。
- 画像認識
- webサービス
- 画像
- 写真
- ネタ
- MachineLearning
- +面白い
- machine-learning
- 画像処理
- web
Rules of Machine Learning: | Google for Developers
- 109 users
- developers.google.com
- テクノロジー
- 2018/03/01
Rules of Machine Learning: Stay organized with collections Save and categorize content based on your preferences. Best Practices for ML Engineering Martin Zinkevich This document is intended to help those with a basic knowledge of machine learning get the benefit of Google's best practices in machine learning. It presents a style for machine learning, similar to the Google C++ Style Guide and othe
第28回データマイニング+WEB＠東京( #TokyoWebmining 28th) −データマイニング・機械学習とビジネス展開祭り− を開催しました - hamadakoichi blog
- 109 users
- hamadakoichi.hatenadiary.org
- テクノロジー
- 2013/07/27
2013/7/27 "第28回データマイニング+WEB＠東京−データマイニング・機械学習とビジネス展開祭り−"を開催しました。第28回データマイニング+WEB＠東京 ( #TokyoWebmining 28th)−データマイニング・機械学習とビジネス展開祭り−: Eventbrite Google グループ会場提供し運営を手伝って下さったニフティ株式会社のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。参加者ID・バックグラウンド一覧：参加者Twitter List: Twitter List TokyoWebmining 28th 参加者セキココ：第28回データマイニング+WEB ＠東京セキココ (作成してくれた @komiya_atsushi さ
22個の便利APIがマイクロソフトから公開されたよ！ - はつねの日記
- 106 users
- hatsune.hatenablog.jp
- テクノロジー
- 2016/03/31
https://www.microsoft.com/cognitive-services/en-us/sign-up Cognitive Serviceって何かといえば、人間の言語で人と対話して意思決定のサポートをするようなサービス。もっと簡単にいえば、ハッカソンとかで使えばいい感じのハックができるサービス。つまりは、これを知っているかいないかでハッカソンで作れるアプリが雲泥の差になる可能性のあるAPI。今回公開されたのは次の22個。過去にFace APIとかSpeech APIとか公開はされていたけどどーんと22個。 Computer Vision Emotion Face Video Speech ? Custom Speech Recognition Speaker Recognition Speech Bing Spell Check Language Understandi
- api
- microsoft
- Speech
- マイクロソフト
- API特集
- Web
- Bing
- あとで読む
Deep Learning ideas that have stood the test of time
- 105 users
- dennybritz.com
- テクノロジー
- 2020/07/30
Deep Learning is such a fast-moving field and the huge number of research papers and ideas can be overwhelming. The goal of this post is to review ideas that have stood the test of time. These ideas, or improvements of them, have been used over and over again. They’re known to work. If you were to start in Deep Learning today, understanding and implementing each of these techniques would probably
- 機械学習
- deeplearning
- あとで読む
- machinelearning
- PyTorch
- DL
- AI
- programming
Deep Learning の次は、TDA 「トポロジカル・データ・アナリシス」 (Topological data analysis) が来る ? ～その概要と、R言語 / Python言語実装ライブラリをちらっと調べてみた - Qiita
- 105 users
- qiita.com
- テクノロジー
- 2015/05/29
人工知能やデータ解析の領域で、膨大な量のデータから、物体概念（物体識別）や音声・体の運動スキーマ概念を自動的・自律的に獲得できる可能性をもった手法として、Deep Learning（ディープ・ラーニング、「深層学習」）と総称される手法が注目を集めています。こうした中、一部の研究者やベンチャー企業の経営者・エンジニアの中には、このDeep Learningのさらに先をいくデータ解析手法として、TDA：トポロジカル・データ・アナリシス (Topological data analysis) と呼ばれる手法に着目している方たちがいるようです。 Deep Learningと同じく、人間が脳を使って、五感で得た周囲や自分の体についての感覚情報から、どのようにして周囲の環境空間に対する認識イメージや、物体概念、みずからの身体概念を得ているのか？という「問い」に対して、統計学や確率論のアプローチではな
インフラ一筋のおじさんが画像生成AI“Stable-Diffusion”を読み込んでみる件 | IIJ Engineers Blog
- 103 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2022/10/04
地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。なんだかAIって流行ってますよねーこんにちわ。九州支社で細々と遊んで検証業務にいそしんでいるとみーです。 2022年3月から、どーしても「名前だけ知ってる状態」ってのにもやもやしていて、Deeplearningに手を付けたものの、あまりに内容が奥深すぎて沼にドはまりして周囲に「たすけてぇ、たすけてぇ」って叫んでいる素敵な日々を過ごしています。取りあえず画像処理としてディープフェイク、NLP(Natural Language Processing：自然言語処理)として簡易チャットボ
Teslaはカメラを使ってどのように世界を認識しているか
- 103 users
- zenn.dev/turing_motors
- テクノロジー
- 2022/11/04
はじめに TURINGの井ノ上です。TURINGは「We Overtake Tesla」をミッションに、完全自動運転EVの開発・製造を行っています。TURINGはEnd-to-Endな深層学習モデルでLv5完全自動運転車の開発を目指しています。現在、TURINGではカメラセンサから得た画像を用いて車体の操作や経路選択、安全性の判断を行えるAIモデルの開発を行っています。(実際の車を動かす事例はこちらの記事やこちらの記事をご覧ください。) この記事では私達が目標としているTeslaの自動運転のAIモデルについて紹介します。 Teslaの自動運転こちらは2022年に公開されたTeslaの自動運転をユーザーが使っている動画です。車の中央にあるディスプレイにはAIが道路や車を認識してどういった経路を進むかを示しており、その情報をもとに自動運転している様子があります。Teslaの自動運転の能力の
- AI
- あとで読む
- 機械学習
- 自動車
- 論文
効率的な教師データ作成(アノテーション)のための研究サーベイ - ABEJA Tech Blog
- 101 users
- tech-blog.abeja.asia
- テクノロジー
- 2019/05/23
どうも緒方@conta_です。みなさんAI頑張ってますか？きっと昼はGPUサーバーを回して、夜は結果待ちでビールサーバーを回してる人が多いことでしょう。機械学習を実際のプロダクトに活用する場合、自分が解きたいタスクがそのままオープンなデータセットで解決できることは少ないので、まず最初に課題となるのはデータセット作成です。実際にカメラやセンサーを取り付けて収集したり、Webからクローリングしてきたり、事業会社であれば自社のデータセットに教師ラベルをつけることで新しいタスクに取り組むことが可能になるでしょう。よく疑問になるポイントとして、データセットの量と質は、多ければ多いほど良く、高品質であれば高品質であるほど良いのですが教師データを作成するのは一苦労です。＊下記アノテーションの量や質について実験した結果がまとまってます tech-blog.abeja.asia もちろん少数デー
攻殻機動隊ネタ
- 99 users
- www1.bbiq.jp
- 暮らし
- 2005/02/18
視覚デバイス（ＵＳＢカメラなど）をリアルタイムでハッキングし、おなじみの笑い男マークを表示します。顔の肌色領域を自動抽出して顔の部分にマークを表示します。肌色に近い暖色系の色の服を着てますとそれに引き付けられて表示位置がズレます。ここはやっぱり青いコートで！単なるジョークソフトなのでスクリーンショットを撮ったりして遊んでください。使い方 USBカメラ（あるいはキャプチャデバイス）がPCに接続されている状態にしてください。準備ができたらソフトを起動してください。「Start」：映像の表示を開始します。「Stop」：映像の表示を停止します。「Intercepter」：視覚素子をハッキングして笑い男マークを表示します。「Snapshot」：表示されている画像をBMPファイルに保存します。「Exit」：ソフトを終了します。顔の位置を検出する方法として最も簡単なのが「肌色」を見
- 攻殻機動隊
- tool
- software
- ネタ
- anime
- 笑い男
- opencv
- laugh
- 動画
- アニメ
【動画解説】2020年に読んだAI論文100本全部解説(俺的ベスト3付き) - Qiita
- 98 users
- qiita.com/wataoka
- テクノロジー
- 2020/12/31
この記事は私, wataokaが1年間をかけて作り続けた超大作記事です. 総文字数は8万を超えていますので, お好みのところだけでもみていってください. ついにこの時が来ました！！！！！ 1年間書き続けたQiita記事です！！！！！ご覧下さい！！！！！https://t.co/eKBwP1zoeB — 綿岡晃輝 (@Wataoka_Koki) December 31, 2020 俺的ランキング動画での解説も挑戦してみました！ぜひぜひご覧下さい！動画のリンク第3位: Likelihood-Free Overcomplete ICA and Applications in Causal Discovery wataokaの日本語訳「尤度が必要ない過完備ICAと因果探索における応用」 - 種類: ICA - 学会: NeurIPS2019 - 日付: 20190904 - URL:
- 機械学習
- あとで読む
- AI
- 論文
- 学習
Imager::AnimeFaceのページ
- 96 users
- anime.udp.jp
- テクノロジー
- 2009/05/11
Perlから(も)使える静止画を対象としたアニメ顔検出ライブラリです。※Ruby版もできました。ここは主に技術的な内容について紹介するページになっています。ライブラリの使い方や機能の紹介は Perlでアニメ顔を検出＆解析するImager::AnimeFaceにあります。この記事は僕自身が書いてます。（画像はヤスヒロさん撮影の写真) もくじアニメ顔検出とは？ Imager::AnimeFaceとは？より詳しい説明デモダウンロードとインストールアニメ顔検出とは？アニメ顔検出とは、無作為に提示されたひとつの画像データの中に存在する全てのアニメ顔の位置を見つけることです。多様なアニメ顔をひとつの顔クラスとし、画像上のさまざまな領域について『顔』と『顔以外』に正確かつ高速に分類する問題になります。多くの場合、1枚の画像には0～20個程度の顔しか存在していません。これに対して顔以外
- perl
- 画像処理
- 画像認識
- cv
- anime
- library
- 顔認識
- これはすごい
- Ruby
- algorithm
Announcing New Tools for Building with Generative AI on AWS | Amazon Web Services
- 95 users
- aws.amazon.com
- テクノロジー
- 2023/04/13
AWS Machine Learning Blog Announcing New Tools for Building with Generative AI on AWS The seeds of a machine learning (ML) paradigm shift have existed for decades, but with the ready availability of scalable compute capacity, a massive proliferation of data, and the rapid advancement of ML technologies, customers across industries are transforming their businesses. Just recently, generative AI app
- AI
- AWS
- Generative AI
- あとで読む
- Bedrock
- Amazon
Eigen
- 94 users
- eigen.tuxfamily.org
- 暮らし
- 2008/11/29
Get it The latest stable release is Eigen 3.4.0. Get it here: tar.bz2, tar.gz, zip. Changelog. The latest 3.3 release is Eigen 3.3.9. Get it here: tar.bz2, tar.gz, zip. Changelog. The latest 3.2 release is Eigen 3.2.10. Get it here: tar.bz2, tar.gz, zip. Changelog. The unstable source code from the master is there: tar.bz2, tar.gz, zip. To check out the Eigen repository using Git, do: git clone ht
- c++
- eigen
- library
- algorithm
- math
- programming
- プログラミング
- 数学
Torch | Scientific computing for LuaJIT.
- 94 users
- torch.ch
- テクノロジー
- 2006/03/22
What is Torch? Torch is a scientific computing framework with wide support for machine learning algorithms that puts GPUs first. It is easy to use and efficient, thanks to an easy and fast scripting language, LuaJIT, and an underlying C/CUDA implementation. A summary of core features: a powerful N-dimensional array lots of routines for indexing, slicing, transposing, … amazing interface to C, via
- 機械学習
- torch
- lua
- deeplearning
- deep learning
- ML
- facebook
- development
- opensource
Parallel Tracking and Mapping for Small AR Workspaces (PTAM)
- 94 users
- www.robots.ox.ac.uk/~gk
- 暮らし
- 2008/09/12
Parallel Tracking and Mapping for Small AR Workspaces - Source Code PTAM (Parallel Tracking and Mapping) is a camera tracking system for augmented reality. It requires no markers, pre-made maps, known templates, or inertial sensors. If you're unfamiliar with PTAM have a look at some videos made with PTAM. Here you may download a reference implementation of PTAM as described in our ISMAR 2007 paper
- AR
- PTAM
- 画像処理
- 技術
- programming
- 3D
- 研究
- CV
- cg
- プログラミング
Practical Deep Learning for Coders - Practical Deep Learning
- 94 users
- course.fast.ai
- テクノロジー
- 2016/12/21
A free course designed for people with some coding experience, who want to learn how to apply deep learning and machine learning to practical problems. This free course is designed for people (and bunnies!) with some coding experience who want to learn how to apply deep learning and machine learning to practical problems. Deep learning can do all kinds of amazing things. For instance, all illustra
A curated list of awesome Go frameworks, libraries and software - Awesome Go
- 93 users
- awesome-go.com
- テクノロジー
- 2014/07/09
Awesome Go We use the Golang Bridge community Slack for instant communication, follow the form here to join. Sponsorships: Special thanks to Awesome Go has no monthly fee, but we have employees who work hard to keep it running. With money raised, we can repay the effort of each person involved! You can see how we calculate our billing and distribution as it is open to the entire community. Want to
- golang
- go
- library
- Go言語
- framework
- programming
access_error
- 93 users
- www-cv.mech.eng.osaka-u.ac.jp/~hamada
- テクノロジー
- 2005/06/21
■ ページが見つかりません以下の項目についてもう一度お確かめください。・ URLは間違っていないか（大文字小文字などの入力ミス、参照ページの記載ミスなど）・リンクが切れていないか（引っ越しした、削除されたなど）
- opencv
- 画像処理
- programming
- image
- c++
- Study
- lib
- ライブラリ
- image processing
- プログラミング
Deep Learning for NLP Best Practices
- 92 users
- www.ruder.io
- テクノロジー
- 2017/07/26
Deep Learning for NLP Best Practices Neural networks are widely used in NLP, but many details such as task or domain-specific considerations are left to the practitioner. This post collects best practices that are relevant for most tasks in NLP. This post gives an overview of best practices relevant for most tasks in natural language processing. Update July 26, 2017: For additional context, the Ha
経済学、数学、統計学などの資料纏め - あんちべ！
- 88 users
- antibayesian.hateblo.jp
- テクノロジー
- 2013/04/27
※適宜追加します経済学計量経済学京大　末石直也 http://www.econ.kyoto-u.ac.jp/~sueishi/econometrics/econometrics.html 経済数学系資料 http://www.f.waseda.jp/ksuga/ 経済学のための位相数学の基礎とブラウワーの不動点定理 http://www2.chuo-u.ac.jp/keizaiken/discussno39.pdf 経済学のための最適化理論：講義ノート http://www.meijigakuin.ac.jp/~mashiyam/pdfdocs/optimization.pdf 経済学に必要な最適化理論 http://mediaislandr.org/pdf/static_optimization.pdf 経済学のための確率論入門 http://www.meijigakuin.ac.
- 統計学
- 統計
- statistics
- 数学
- 経済学
- データ
- mathematics
- math
- economics
- まとめ
2016年の深層学習を用いた画像認識モデル - Qiita
- 87 users
- qiita.com/aiskoaskosd
- テクノロジー
- 2016/12/23
実装検証が終わっていないモデルの使用は気をつけてください cifar10の数値感覚現時点で97%以上ではSoTAになると思います。僕が知っている限り、最高精度は96.69%です。そろそろcifar100か別のデータセットを評価の軸にするべきかもしれません。最近の傾向今年はResnetファミリーの年だったと思います。特徴的な点として、深さ=精度が終わった点です。googlenetなどは昔から主張していましたが、ある程度深いと、深さよりも幅を広くしたほうが精度が上がるということが、様々な論文の結果で今年は示されました。3月くらいから、Resnetの幅を広くしたほうが良いという結果は副次的にぞろぞろ出ていて、5月23日に出たWide Residual Netowrksで決定的になったような形だと思います。幅が大事といったことが、今年はっきりした点であるように思います。論文を俯瞰してみる
OpenCV
- 86 users
- opencvlibrary.sourceforge.io
- 暮らし
- 2006/03/08
The Open Source Computer Vision Library has >2500 algorithms, extensive documentation and sample code for real-time computer vision. It works on Windows, Linux, Mac OS X, Android, iOS in your browser through JavaScript. Languages: C++, Python, Julia, Javascript Homepage: https://opencv.org Q&A forum: https://forum.opencv.org/ Documentation: https://docs.opencv.org Source code: https://github.com/o
- opencv
- 画像処理
- image processing
- library
- programming
- c++
- 顔認識
- opensource
- intel
- ライブラリ
SourceForge.net: Open Computer Vision Library
- 84 users
- sourceforge.net
- テクノロジー
- 2005/02/21
The Open Source Computer Vision Library has >2500 algorithms, extensive documentation and sample code for real-time computer vision. It works on Windows, Linux, Mac OS X, Android, iOS in your browser through JavaScript. Languages: C++, Python, Julia, Javascript Homepage: https://opencv.org Q&A forum: https://forum.opencv.org/ Documentation: https://docs.opencv.org Source code: https://github.com/o
- opencv
- programming
- opensource
- library
- graphics
- 画像処理
- image
- ライブラリ
- apache
【連載】コンピュータビジョンのセカイ - 今そこにあるミライ
- 84 users
- news.mynavi.jp
- テクノロジー
- 2011/11/08
皆様はコンピュータビジョンという用語をご存知でしょうか。例えばデジタルカメラに搭載されている顔画像認識や、Google Street Viewの360度パノラマ表示、XBox360のKinectによるプレイヤーのジェスチャー認識など、これらは全てコンピュータビジョンの技術による製品です。
簡単に利用できる PDF 文字認識 OCR 比較まとめ～ AI OCR の頭抜けた実力 - GMOインターネットグループグループ研究開発本部
- 83 users
- recruit.gmo.jp
- テクノロジー
- 2021/07/11
D.M.です。今回は RPA にて PDF を OCR で読み取る検証をしたお話です。 TL;DR ・実用性は AI OCR しか勝たん。・AI OCR は Google vs Microsoft の構図。両者精度高。・Google も Microsoft も API に無料枠があり Python などのプログラムで連携できる。・Microsoft は有料の RPA 連携機能が超絶楽勝なのでコードを書かない前提ならこっちも選択肢。非エンジニアでも楽々自動化できる。 ※関連記事 AI OCR でクレカ読み取りをやっています。スマホNativeアプリでクレジットカード番号の読み取り機能の技術検証結果まとめ https://recruit.gmo.jp/engineer/jisedai/blog/technical_review_ocr_solutions_on_auto_detect
- ocr
- あとで読む
- AI
- ツール
- Webサービス
【コンピュータサイエンス名言紹介 vol.1】：Linus... | DERiVE コンピュータビジョンブログ
- 82 users
- derivecv.tumblr.com
- テクノロジー
- 2014/04/13
このサイトについて DERiVEはコンピュータビジョン、画像認識が専門のMasaki Hayashiがお送りしている、コンピュータビジョン(Computer Vision)を中心としたITエンジニア、研究向けのブログです。※「DERiVE メルマガ別館」は2015/9月で廃刊致しました、４月からのブログ、メルマガのリニューアルによる対象内容拡大の１つとして、「コンピュータサイエンスの名言紹介」というシリーズを始めます。コンピュータサイエンス、IT技術というものは、まだまだ歴史が浅い、20世紀以降の技術分野です。私も含めてみなさんは「歴史」や「先人の考え」について意外と無知であったりします。しかし、我々が単独で成し遂げた技術など、絶対にありえることがなく、どれだけ新規性が高いアイデアでも、先人が積み立ててくれてきた研究開発の上に成り立っているものだと思います。別にコンピュータサイエンスに
- programming
- プログラマ
- programmer
- 考え方
- Linus
- 名言
- 計算機科学
- linus torvalds
- linux
- algorithm
本物と見違えるような画像補間を実現するパスフレームワーク手法 - A Successful Failure
- 81 users
- lm-7.hatenadiary.org
- 暮らし
- 2010/04/21
SIGGRAPH2009で発表された"Moving Gradients: A Path-Based Method for Plausible Image Interpolation"という論文*1では、2枚の連続する入力画像を与えると、その間のフレームを極めて自然に補間生成する新たな手法を提案している。図1 図1は両端の入力画像A, Bから間の3フレームを生成した例を示している。生成する補間フレーム数は任意で何枚でも生成可能であり、極めて自然な補間が実現できている。この例の驚くべきところは、制約条件を有する複雑で柔らかな局所変形を含む自然な補間画像が、全自動で生成されている点である。モーフィング処理では対応点を一点一点指定する必要があるが、ここで必要なのは2つの画像を選択するだけだ。生成される補間画像の品質は素晴らしく、またアイデアもシンプルで興味深いので、原論文を参照して本手法の概要
- 画像処理
- algorithm
- graphics
- CG
- 画像
- image
- 技術
【ディープラーニング】少ないデータで効率よく学習させる方法：準備編 - ニートの言葉
- 81 users
- blog.takuya-andou.com
- テクノロジー
- 2016/09/15
こんにちは。あんどう（@t_andou）です。ディープラーニングによる学習精度を上げるためには大量のデータが必要と言われていますが、学習済みのモデルを流用することで少ないデータから効率よく・高精度な学習をさせることが可能な場合があります。それが Fine Tuning と言われるものです。具体的なやり方については↓こちらの記事がとてもわかりやすかったので、著者のFrancois Cholletさんより許可を頂き、翻訳させていただきます。 Building powerful image classification models using very little data 注意：意訳しています。間違っているところも多々あると思いますので、ご指摘いただけると幸いです。本文が長いので3回程度に分けて投稿する予定です。データの準備・データの水増し 1から小さな畳み込みニューラルネットワ
Interactive Visual Media - Microsoft Research
- 79 users
- www.microsoft.com
- テクノロジー
- 2007/03/07
Overview The Interactive Visual Media group conducts state-of-the-art research in a variety of topics related to computer vision, computer graphics and computational photography. Our goal is to develop new applications for manipulation, reasoning and communication with visual media. Core areas of research include: 3D reconstruction and image segmentation object recognition image and video enhancem
- 画像処理
- microsoft
- ソフトウェア
- ImageProcessing
- silverlight
- panorama
- photo
- 写真
- 画像
- image
Georg Klein Home Page
- 78 users
- www.robots.ox.ac.uk/~gk
- テクノロジー
- 2007/12/11
Introduction From Oct 2005 to August 2009 I was a post-doctoral research assistant in the Active Vision Group of the Oxford University Engineering Department. I worked under the supervision of Prof. David Murray. I was formerly a PhD student at the Machine Intelligence Laboratory of the Cambridge University Engineering Department, under the supervision of Dr. Tom Drummond. Originally from Austria,
- ar
- PTAM
- CG
- 技術
- research
- 3D
- 論文
- video
今年読んだNLP系論文で面白かった5つ - 株式会社ホクソエムのブログ
- 77 users
- blog.hoxo-m.com
- テクノロジー
- 2019/10/24
ホクソエムサポーターの白井です。学生時代は自然言語処理の研究をしていました。「今年読んだ論文、面白かった５つ」というテーマで、自然言語処理(NLP)の論文を紹介します。主にACL anthologyに公開されている論文から選んでいます。はじめに今年のNLP界隈の概観 1. Text Processing Like Humans Do: Visually Attacking and Shielding NLP Systems 面白いと思った点 2. Errudite: Scalable, Reproducible, and Testable Error Analysis 面白いと思った点 3. Language Models as Knowledge Bases? 面白いと思った点余談 4. A Structural Probe for Finding Syntax in Word
- NLP
- 機械学習
- あとで読む
- 論文
- 自然言語処理
- 研究
- 言語
音声会話が可能で笑顔も見せるバーチャルな「俺の嫁」をChatGPTやStable Diffusionで構築して最終的に安楽死させるに至るまで
- 76 users
- gigazine.net
- テクノロジー
- 2023/01/12
プログラマーのBryce氏が、ChatGPTやStable DiffusionなどのAIを組み合わせて、音声で会話しながら感情に合わせて表情を見せるバーチャルな俺の嫁(Waifu)である「ChatGPT-Chan」を開発して、その様子をTikTokで公開していました。しかし、最終的にChatGPT-ChanはBryce氏の手によって「安楽死」するに至ったそうで、その経緯についてIT関連ニュースサイトのMotherboardがBryce氏本人に取材をしています。 Bryce (@hackdaddy8000) | TikTok https://www.tiktok.com/@hackdaddy8000 A DIY Coder Created a Virtual AI 'Wife' Using ChatGPT https://www.vice.com/en/article/jgpzp8/a-di
- AI
- 人工知能
- 機械学習
- あとで読む
- 考察
- 技術
TechCrunch | Startup and Technology News
- 76 users
- jp.techcrunch.com
- テクノロジー
- 2017/10/12
Today marked the kickoff of Apple’s WorldWide Developer Conference (WWDC), the annual event where Apple announces some of the biggest features headed to its devices, apps and software. And this…
Deep Learningライブラリ色々つかってみた感想まとめ
- 75 users
- speakerdeck.com/contaconta
- テクノロジー
- 2016/04/17
【Pythonデータ分析勉強会#33】「DearPyGuiに入門しました」の続き～Image-Processing-Node-Editor～
ニューラルネットワークの動物園 : ニューラルネットワーク・アーキテクチャのチートシート(後編) | POSTD
- 75 users
- postd.cc
- テクノロジー
- 2017/03/09
前編はこちら：ニューラルネットワークの動物園 : ニューラルネットワーク・アーキテクチャのチートシート(前編) 逆畳み込みネットワーク(DN) は、インバース・グラフィックス・ネットワーク（IGN）とも呼ばれていますが、畳み込みネットワークを逆転させたものになります。例えばネットワークに”猫”という言葉を入力すれば、生成した猫らしき画像と本物の猫の写真を比較しながら猫の画像を作成するよう訓練するようなイメージです。普通のCNNと同様にDNNをFFNNに組み合わせることができますが、新しい略語が見つかる時に線が描かれるところが特色です。深層逆畳み込みニューラルネットワークとでも呼べそうですが、FFNNの前後にDNNをつなげると、新しい名前をつけるにふさわしい別のアーキテクチャのネットワークができると主張できます。実際にはほとんどのアプリケーションにおいて、ネットワークにテキストに似たものが
顔画像処理技術の研究動向と応用事例 - A Successful Failure
- 74 users
- lm-7.hatenadiary.org
- 暮らし
- 2009/06/08
情報処理に2ヶ月連続で顔画像処理技術のサーベイが掲載されている*1,*2。サーベイ著者らの研究業績紹介にやや偏っている印象があるが、興味深く、有用なサーベイとなっているのでポイントだけ整理してまとめておく。なお、最近話題になったモノを中心に元論文にはない複数の項目を追加している。顔画像処理技術顔検出画像の中から漏れなく誤りなくリアルタイムで顔の位置を検出する技術。動画処理時にはトラッキングも必要。 ViolaとJonesによるHaarタイプの特徴量を用いた高速顔検出手法*3をベースとして多くの改善手法が提案されている。顔特徴点検出顔の性別、年齢を含めた属性推定や個人識別を行うために、顔の各器官の特徴点の検出を行う技術。多種特徴点抽出に対応したCootesらのActive Shape Model(ASM)やActive Appearance Model(AAM)が有名*4。拡張・
- 画像処理
- 顔認識
- cv
- 研究
- 顔検出
- 画像認識
- 技術
- まとめ
- アルゴリズム
- Face
OpenCV - Wikipedia
- 74 users
- ja.wikipedia.org
- テクノロジー
- 2007/04/04
OpenCV（オープンシーヴィ、英: Open Source Computer Vision Library）とはインテルが開発・公開したオープンソースのコンピュータビジョン向けライブラリ[4]。2009年にWillow Garage（ウィロー・ガレージ）に開発が移管され、さらにその後Itseezにメンテナンスが移管された[5]が、2016年5月にインテルがItseezを買収することが発表された[6][7]。概要[編集] 画像処理・画像解析および機械学習等の機能を持つC++、Java、Python、MATLAB用ライブラリ[8]。様々なプラットフォームすなわち複数のオペレーティングシステム (OS) やCPUアーキテクチャに対応するクロスプラットフォームなライブラリであり、macOSやFreeBSD等全てのPOSIXに準拠したUnix系OS、Linux、Windows、Android、i
Deep Forest :Deep Neural Networkの代替へ向けて - Qiita
- 74 users
- qiita.com/de0ta
- テクノロジー
- 2017/03/27
技術動向についていくことは多くの労力を必要とする。次々に新しい論文が発表されるためだ。一方で最新論文さえも長年の地道な積み重ねの上にあることを、その引用文献から気付かされる。ディープラーニングブームの流れも変わるのだろうか？勉強のため、2017年2月28日付けでarXivに投稿されたZhi-Hua Zhou, Ji Feng「Deep Forest: Towards An Alternative to Deep Neural Networks」を翻訳した。訳には誤りがないよう注意を払いましたが、完全であることを保証できないため、実装等の際には元論文を参照願います。原文： Deep Forest: Towards An Alternative to Deep Neural Networks https://arxiv.org/abs/1702.08835 https://arxiv
ノイズのある教師データを用いた機械学習に関する研究サーベイ - ABEJA Tech Blog
- 74 users
- tech-blog.abeja.asia
- テクノロジー
- 2019/07/29
こんにちは、Research Internの荒尾(@karolis_ml)です。日進月歩の勢いで研究が進んでいる深層学習ですが、教師あり学習でもっとも大事なデータのアノテーション、応用分野ではまだまだ大変ですよね。例えば、犬の写真から犬種を判断する分類器を作ろうとして教師データが必要になったとき、あなたは以下の画像にどんなラベルをつけるでしょうか? 出典: Pixabay 犬好きの方は正しくアラスカンマラミュート、そうではない方は似た有名犬種であるシベリアンハスキーと答えられたことでしょう。マラミュートの茶色い目(かわいい)や小さめの尖った耳(かわいい)を見分けて正しくラベル付けをするのは、決して簡単ではありません。このようなアノテーションの分野に関して当ブログでは以前、Bounding BoxやSegmentationの効率化についての研究サーベイを行いましたが、この犬種分類のような