ComputerVisionの人気記事 51件 - はてなブックマーク

1 - 40 件 / 51件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

ComputerVisionの検索結果1 - 40 件 / 51件

ComputerVisionに関するエントリは51件あります。 AI、機械学習、画像処理などが関連タグです。人気エントリには『Stable Diffusion を基礎から理解したい人向け論文攻略ガイド【無料記事】』などがあります。

Stable Diffusion を基礎から理解したい人向け論文攻略ガイド【無料記事】
- 592 users
- ja.stateofaiguides.com
- テクノロジー
- 2022/10/11
GPTが人知れず既存の名刺管理アプリを抹殺していた話 - Qiita
- 505 users
- qiita.com/watanabe-tsubasa
- テクノロジー
- 2024/02/27
名刺管理アプリ作ってほしいといわれたそれは2/22のお話。ことの発端は別の部署からかかってきた一本の電話でした。新規事業の部署でいろいろな取引先様と付き合いがあるものの、紙の名刺が非常に多く管理に困っているとのことのことです。私は小売業に勤務しているしがない一社員で、現在Eコマースの戦略立案に関する部署に所属しています。電話先の方は、以前一緒の部署で勤務したことがある方です。現在新規事業のプロジェクト推進をしており、冒頭のような課題感を持っているため既存の名刺管理アプリ導入を考えたのですが、あまりのお値段の高さに卒倒して私に藁をもすがる思いで連絡されたようです。これまでのアプリは名刺の識別専門のAI（）を使っていた話を聞いてみたところ、名刺の写真を撮る会社名、部署名、名前、…など項目別にスプレッドシートへ記載されるスプレッドシートに次の打ち合わせ日を記載しておくと通知さ
- ChatGPT
- あとで読む
- AI
- OCR
- python
- api
- アプリ
- GPT
- LINE
- プログラミング
https://jp.techcrunch.com/2020/07/28/2020-07-14-opencv-ai-kit-aims-to-do-for-computer-vision-what-raspberry-pi-did-for-hobbyist-hardware/
- 331 users
- jp.techcrunch.com
- テクノロジー
- 2020/07/28
- OpenCV
- あとで読む
- AI
- IoT
- RaspberryPi
- 開発
- gadget
- 画像処理
- Raspberry Pi
- 電子工作
Teslaにおけるコンピュータビジョン技術の調査
- 185 users
- www.slideshare.net/slideshow
- テクノロジー
- 2022/01/07
2. Mobility Technologies Co., Ltd. 宮澤一之株式会社Mobility Technologies AI技術開発部 AI研究開発第二グループグループリーダー経歴 April 2019 - March 2020 AI研究開発エンジニア@DeNA April 2010 - March 2019 研究員@三菱電機 March 2010 博士@東北大学自己紹介 2 @kzykmyzw 3. Mobility Technologies Co., Ltd. 3 2014年10月：Autopilot誕生 2015年10月：「バージョン7.0」リリース 2016年01月：Summonベータ版をリリース 2016年10月：第2世代のハードウェアを全車種搭載へ 2018年10月：Autopilotにナビゲーション機能追加 2019年09月：Smart Summon機能リ
- Tesla
- あとで読む
- AI
- deeplearning
- 画像処理
- 機械学習
- car
- tech
- technology
- 自動運転

畳み込み+Attention=最強？最高性能を叩き出した画像認識モデル「CoAtNet」を解説！ - Qiita
- 109 users
- qiita.com/omiita
- テクノロジー
- 2021/11/16
1. CoAtNetの解説 1.1 畳み込みとSAの復習コンピュータビジョンで用いられている大きな仕組みに畳み込みとSelf-Attention(=SA)があります。畳み込みではEfficientNet、SAではViTが有名ですね。EfficientNetについてはこちらの拙著記事、ViTについてはこちらの拙著記事をご参照ください。CoAtNetでは、この畳み込みとSAの良いとこ取りをしたブロックを作ることが一番の目的になっています。畳み込みとSAの式を復習しておきましょう。ここでは畳み込みの中でもDW(=Depthwise)畳み込みを取り扱います。そして、本論文では分かりやすさを優先しているのか、式の細かいところ(SAにおけるqkvの埋め込みなど)はあえて排除しているように見えるので、理解しやすいです。 1.1.1 畳み込みの式本論文では、畳み込みの中でもDW(=Depthwise)
- 機械学習
- あとで読む
- AI
- deeplearning
- Qiita
- 画像
物体検出のDeepLearning読むべき論文7選とポイントまとめ【EfficientDetまでの道筋】 - Qiita
- 83 users
- qiita.com/kazukiii
- テクノロジー
- 2020/09/05
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? お久しぶりです。 2012年のHintonさんのAlexNetによるILSVRCでの圧勝を皮切りに、画像認識の世界でもDeepLearningが脚光を浴びることとなりました。物体検出の世界でも現在DeepLearningを用いたモデルが主流になっています。 https://paperswithcode.com/sota/object-detection-on-coco を見ると、 COCO test-devにおいて、state-of-the-art(SoTA)のモデルはEfficientDet-D7xのようです。独断と偏見も少々あり
ブラウザで動くリアルタイム画像/音声処理アプリをStreamlitでサクッと作る
- 67 users
- zenn.dev/whitphx
- テクノロジー
- 2021/12/09
Overview 画像/音声処理をリアルタイムで行う、Webブラウザから利用できるアプリをStreamlitで作る方法を解説します。 StreamlitのおかげでPythonだけでwebアプリが作れます。さらに、一番簡単な例なら10行程度のPythonコードで、webカメラを入力にしてブラウザから利用できるリアルタイム画像処理アプリケーションになります。 Webベースなのでクラウドにデプロイでき、ユーザに簡単に共有して使ってもらえ、UIもイマドキで綺麗です。人物・物体検知、スタイル変換、画像フィルタ、文字起こし、ビデオチャット、その他様々な画像・音声処理の実装アイディアをデモ・プロトタイピングするのになかなかハマる技術スタックではないでしょうか。 Webブラウザから利用できる物体検知デモの例。実行中に閾値をスライダーで変えられる。オンラインデモ🎈 同様にスタイル変換デモの例。実行中にモ
- Streamlit
- python
- あとで読む
- 画像処理
- ブラウザ
- webサービス
- web
- 画像
自然言語処理とVision-and-Language / A Tutorial on NLP & Vision-and-Language
- 59 users
- speakerdeck.com/kyoun
- テクノロジー
- 2022/06/14
2022年度人工知能学会全国大会（第36回）チュートリアル講演資料
効率的学習 / Efficient Training（メタサーベイ）
- 42 users
- www.slideshare.net/slideshow
- テクノロジー
- 2021/05/04
cvpaper.challenge のメタサーベイ発表スライドです。 cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。 http://xpaperchallenge.org/cv/ Read less
NLPとVision-and-Languageの基礎・最新動向 (2) / DEIM Tutorial Part 2 Vision-and-Language
- 40 users
- speakerdeck.com/kyoun
- テクノロジー
- 2023/03/08
DEIM2023 第15回データ工学と情報マネジメントに関するフォーラムチュートリアル講演資料 Part2: Vision-and-Language
NLPとVision-and-Languageの基礎・最新動向 (1) / DEIM Tutorial Part 1: NLP
- 36 users
- speakerdeck.com/kyoun
- テクノロジー
- 2023/03/08
DEIM2023 第15回データ工学と情報マネジメントに関するフォーラムチュートリアル講演資料 Part1: NLP
- NLP
- 機械学習
- AI
- DeepLearning
- 自然言語処理
- slide
ディープラーニングの先端技術、マルチモーダルの日本語モデルを作ってみた【日本語VL-T5】 - Qiita
- 34 users
- qiita.com/sonoisa
- テクノロジー
- 2021/12/02
要点マルチモーダル深層学習って何？Vision-Language Modelって何？という方向けに、 Google Colabで実際に学習済みモデルを動かしながら技術概要を理解していただけるチュートリアル記事です。マルチモーダルの時代が到来この10年、ディープラーニングの登場により、画像の分類や、文章読解（日本語等の自然言語によるQA）などが高い精度で自動化できるようになりましたね。しかし、画像は画像、自然言語は自然言語・・・と、それぞれに特化した手法の開発が中心で、それらが混在したマルチメディア（マルチモーダル）の問題へのチャレンジは少ない状況に長らくありました。マルチモーダルの重要性は人間の様々な知的判断の場面を思い返せば分かりますね。実課題解決において重要なAI技術分野といえます。シングルモーダルが中心だった潮目はこの1年くらいで変わり、昨今、マルチモーダルな深層学習モデル
TechCrunch | Startup and Technology News
- 24 users
- jp.techcrunch.com
- テクノロジー
- 2021/05/03
TechCrunch Daily News Every weekday and Sunday, you can get the best of TechCrunch’s coverage. Startups Weekly Startups are the core of TechCrunch, so get our best coverage delivered weekly.
- facebook
- AI
- 研究
- あとで読む
- HotEntry
- システム
Teslaは世界最高速のAIプロセッサを発表、自動運転車開発でメーカーがAIスパコンを開発し垂直統合が進む
- 24 users
- etechnologyreview.com
- テクノロジー
- 2021/08/22
TeslaはAIイベント「AI Day」で自動運転車開発の最新状況を公開した。自動運転の中核技術は高度なコンピュータビジョンで、これを開発するためにはAIスパコンが必要となる。TeslaはAIプロセッサを開発し、これをベースに独自のAIスパコンを構築した。更に、自動運転技術をロボットに応用したヒューマノイドを開発することを明らかにした。発表概要 Teslaの自動運転技術は「Full Self-Driving(FSD)」(上の写真)と呼ばれ、他社とは異なり、カメラだけでクルマが自律走行する。AIはカメラの映像を解析し周囲のオブジェクトを把握するが、ニューラルネットワークの規模が巨大になり、また、アルゴリズムを教育するために大量のデータを必要とする。このため、Teslaは独自でAIプロセッサ「D1 Chip」を開発し、アルゴリズム教育を超高速で実行する。自動車メーカーがスパコン開発まで手掛け
- Tesla
- あとで読む
- 自動運転
- technology
- AI
Imagen: Text-to-Image Diffusion Models
- 22 users
- gweb-research-imagen.appspot.com
- テクノロジー
- 2022/05/24
Imagen unprecedented photorealism × deep level of language understanding unprecedented photorealism deep level of language understanding We present Imagen, a text-to-image diffusion model with an unprecedented degree of photorealism and a deep level of language understanding. Imagen builds on the power of large transformer language models in understanding text and hinges on the strength of diffusi
- 画像生成
- GAN
- 自然言語処理
- NLP
- Google
2022.9.7 NAIST DSCサマーセミナー「Vision and Language技術の最新動向」
- 22 users
- speakerdeck.com/sei88888
- テクノロジー
- 2022/09/09
NAIST DSCサマーセミナー2022の発表資料です。 http://www-dsc.naist.jp/dsc_naist/naist-dsc-summer-seminar-2022/
- slide
- あとで読む
- 言語
- 学習
- 技術
- 画像
Segment Anything
- 19 users
- segment-anything.com
- テクノロジー
- 2023/04/05
Meta AI Computer Vision Research
- meta
- research
臨床AIはなにができ、何が難しいか: 臨床AI研究開発の3類型 - エムスリーテックブログ
- 18 users
- www.m3tech.blog
- テクノロジー
- 2020/12/14
こんにちは、エムスリーエンジニアリンググループ/AI・機械学習チームの大垣 (@Hi_king) です。これはエムスリー Advent Calendar 2020 の14日目の記事です。前日は id:juntaki による、Goのchannelとスケジューリングでした。私達AI・機械学習チームの挑戦している課題としては、MLによるサービス体験の向上、MLを中心とする新規サービスなど諸々あるのですが、今日は、なかでも、臨床現場で利用するためのAI開発について書いてみようと思います。上記のスライドはこのテーマで45分ほど社内勉強会を行うために作ったもので、このなかから、エッセンスをかいつまんでブログ記事にしてみました。記事中で紹介しきれなかったそれぞれの研究などはスライドをあらためて眺めていただけると幸いです。私自身は、もともとコンピュータビジョン分野が専門で、医療分野に本格
GitHub - wmuron/motpy: Library for tracking-by-detection multi object tracking implemented in python
- 16 users
- github.com/wmuron
- テクノロジー
- 2021/03/17
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- Python
- HotEntry
- library
Metaが画像だけでなく動画内のオブジェクトもリアルタイムかつ正確に識別可能なAIモデル「Segment Anything Model 2(SAM 2)」をリリース
- 13 users
- gigazine.net
- テクノロジー
- 2024/07/30
Metaが画像や動画内のどのピクセルがどのオブジェクトと関係したものかを正確に識別することができる統合AIモデルの「Segment Anything Model 2(SAM 2)」を発表しました。SAM 2を利用することであらゆるオブジェクトをセグメント化し、動画のすべてのフレームにわたってリアルタイムで一貫した追跡が可能になるため、動画編集や複合現実の分野で革新的なツールとなる可能性があります。 Our New AI Model Can Segment Anything – Even Video | Meta https://about.fb.com/news/2024/07/our-new-ai-model-can-segment-video/ Introducing SAM 2: The next generation of Meta Segment Anything Model f
- 人工知能
- あとで読む
Google Research, 2022 & beyond: Language, vision and generative models
- 12 users
- ai.googleblog.com
- テクノロジー
- 2023/01/19
Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more
Meta AI開発者に聞く「オープンなAI」と「認識のためのAI」【西田宗千佳のイマトミライ】
- 12 users
- www.watch.impress.co.jp
- テクノロジー
- 2024/10/15
- 技術
- あとで読む
Introducing Segment Anything: Working toward the first foundation model for image segmentation
- 8 users
- ai.meta.com
- テクノロジー
- 2023/04/06
Segment Anything’s promptable design enables flexible integration with other systems. SAM could receive input prompts, such as a user’s gaze from an AR/VR headset, like Project Aria. SAM: A generalized approach to segmentation Previously, to solve any kind of segmentation problem, there were two classes of approaches. The first, interactive segmentation, allowed for segmenting any class of object
Update: Expanding access to Meta Segment Anything 2.1 on Amazon SageMaker JumpStart
- 7 users
- ai.meta.com
- テクノロジー
- 2024/07/30
Update: Expanding access to Meta Segment Anything 2.1 on Amazon SageMaker JumpStart Updated February 12, 2025: Last July, we released Meta Segment Anything 2, a follow-up to our popular open source segmentation model, offering developers a unified model for real-time promptable object segmentation and tracking in images and videos. We’ve been blown away by the impact SAM 2 has made across the comm
- Meta
- 人工知能
GitHub - activeloopai/deeplake: Database for AI. Store Vectors, Images, Texts, Videos, etc. Use with LLMs/LangChain. Store, query, version, & visualize any AI data. Stream data in real-time to PyTorch/TensorFlow. https://activeloop.ai
- 7 users
- github.com/activeloopai
- テクノロジー
- 2021/02/23
Deep Lake is a Database for AI powered by a storage format optimized for deep-learning applications. Deep Lake can be used for: Storing and searching data plus vectors while building LLM applications Managing datasets while training deep learning models Deep Lake simplifies the deployment of enterprise-grade LLM-based products by offering storage for all data types (embeddings, audio, text, videos
- dataset
- AI
【論文解説】自然言語処理と画像処理の融合 - OpenAI 『CLIP』を理解する
- 7 users
- data-analytics.fun
- テクノロジー
- 2021/05/17
今回はOpenAIの『CLIP(Contrastive Language-Image Pre-training)』を解説したいと思います。 CLIPは画像の分類に利用されるモデルですが、今までのモデルと何が違うかというと、自然言語処理の技術を応用する点です。一般的な画像分類では、たくさんの画像を用意して、それぞれ対して犬、猫、リンゴ、などのラベルをつけます。それを教師データとして学習します。しかしながら、その方法には以下のような問題点があります。ラベル付けに非常にコストがかかる。ラベルの種類が限定的で、学習対象の種類についてはうまく分類できるが、初めて見る対象(例えば、犬と猫を学習して、果物を分類するなど)については分類精度が低い。 CLIPでは、こういった問題に取り組んでいきます。ちなみに、CLIPはモデルの仕組みではなく事前学習方法ですので、モデル自体はResNetやVisi
- 論文
- clip
- AI
TechCrunch
- 6 users
- jp.techcrunch.com
- テクノロジー
- 2021/12/15
Rivian is offering discounts up to $5,000 on its EVs — and a year of free charging — to customers willing to trade in their gas-powered trucks and SUVs. The deal, which kicked off April 22, is aim
- china
コンピュータビジョン最前線　Winter 2021 - 共立出版
- 6 users
- www.kyoritsu-pub.co.jp
- テクノロジー
- 2021/10/30
コンピュータビジョン研究の最先端をゆくトップランナーたちが織り成す季刊シリーズ創刊！！　cvpaper.challengeおよびCVIM研究会全面協力のもと、最新トレンドのサーベイ、いま注目の最重要論文深読み、肝となる技術や理論のチュートリアルの3本柱で、実用性・信頼性のある最先端情報を、毎号ディープに解説。創刊号のWinter 2021では、まず最新トレンドサーベイ記事「イマドキノCV」で近年のコンピュータビジョン分野において最重要と位置付けられる「データラベルの利活用」や「認識モデルの構築」を扱う。次に論文「フカヨミ」記事を3本掲載し、それぞれ、新規視点画像生成分野で2020年に登場したNeRF、画像処理分野の基本タスクである物体検出技術、いま最も伸びている3D認識アプローチのカテゴリレベル姿勢推定について取り上げる。最後に、チュートリアル記事「ニュウモンVision & Langu
- book
- あとで読む
GitHub - DeNA/nota: Web application for image and video labeling and annotation
- 6 users
- github.com/DeNA
- テクノロジー
- 2021/04/08
Nota is a web application that allows to label and annotate images and videos for use in machine learning. It was created by DeNA Co., Ltd in 2017. It was realeased as Open Source in March 2021. Multiple backends for images and video sources Local Filesystem (mainly used for development) S3 bucket Customizable annotations using JSON templating language Points, binding boxes, polygon annotation in
- annotation
- tool
GitHub - IDEA-Research/Grounded-Segment-Anything: Grounded SAM: Marrying Grounding DINO with Segment Anything & Stable Diffusion & Recognize Anything - Automatically Detect , Segment and Generate Anything
- 5 users
- github.com/IDEA-Research
- テクノロジー
- 2023/04/10
We plan to create a very interesting demo by combining Grounding DINO and Segment Anything which aims to detect and segment anything with text inputs! And we will continue to improve it and create more interesting demos based on this foundation. And we have already released an overall technical report about our project on arXiv, please check Grounded SAM: Assembling Open-World Models for Diverse V
- image
GitHub - rerun-io/rerun: Visualize streams of multimodal data. Free, fast, easy to use, and simple to integrate. Built in Rust.
- 5 users
- github.com/rerun-io
- テクノロジー
- 2023/02/17
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- Rust
- Image
【保存版】さまざまなAI画像処理の手法を学べるレシピ50選（2022年8月版） - Qiita
- 5 users
- qiita.com/AxrossRecipe_SB
- テクノロジー
- 2022/08/01
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに ※本記事は2022年8月16日に20個のレシピを追加し50選へと更新いたしました。 AxrossRecipeを運営している松田です。 AxrossRecipe は、エンジニアの"アカデミックな教育"と"現場の業務"のスキルギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。現役エンジニアによるノウハウが"レシピ"として教材化されており、動くものを作りながらAI開発やデータ分析の流れを追体験できます。 AxrossRecipe: https://axross
- clip
物体検出のエラー分析ツールTIDE | MoT Lab (GO Inc. Engineering Blog)
- 5 users
- lab.mo-t.com
- テクノロジー
- 2021/12/20
この記事はMobility Technologies Advent Calendar 2021の18日目です。こんにちは、AI技術開発AI研究開発第二グループの劉です。私はドラレコ映像から標識などの物体を見つける物体検出技術を開発しているのですが、その精度を改善していくためにはまず検出エラーを細かく分析することが重要です。本記事では、物体検出のエラー分析に関する論文である”TIDE: A General Toolbox for Identifying Object Detection Errors”を解説すると共に、その著者らが公開しているツールを実際に使ってみた結果をご紹介をしたいと思います。はじめに本記事では、以下の論文を取り上げます。コンピュータビジョンで最も有名な国際学会の一つであるECCV（European Conference on Computer Vision）で202
- tool
画像認識向けTransformerを振り返る - Qiita
- 5 users
- qiita.com/TeamN
- テクノロジー
- 2021/10/12
この頃、バカンスシーズンなのか、ネタ切れなのか、画像向けTransformer論文が一息ついているので、ここでちょっと振り返ってみる。 2017年：　そもそもの始まり Attention Is All You Need 自然言語向けに2017年に出たこのGoogle論文で、Attention構造が自然言語の方であっという間に広がる。当然ながら、この流れで、計算量がかかるAttention部分がどんどんと違う手法で置き換えられた論文が増えてくる。 2019年：　画像認識にうっすらと浸透画像認識でもConvolutionの代わりにAttentionが使われ始めたので、論文まとめこの記事で書いたように、ConvolutionをAttentionに変えようという論文が2019年からチラホラと出てくる。この頃は、まだおっかなびっくりAttention構造に取り換えてもいけるぞ、とか、精度変わ
- review
- あとで読む
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale
- 4 users
- arxiv.org
- テクノロジー
- 2021/05/01
While the Transformer architecture has become the de-facto standard for natural language processing tasks, its applications to computer vision remain limited. In vision, attention is either applied in conjunction with convolutional networks, or used to replace certain components of convolutional networks while keeping their overall structure in place. We show that this reliance on CNNs is not nece
- google
An Introduction to Knowledge Graphs
- 4 users
- ai.stanford.edu
- 学び
- 2021/05/23
Knowledge Graphs (KGs) have emerged as a compelling abstraction for organizing the world’s structured knowledge, and as a way to integrate information extracted from multiple data sources. Knowledge graphs have started to play a central role in representing the information extracted using natural language processing and computer vision. Domain knowledge expressed in KGs is being input into machine
- tutorial
Google Cloud、エンタープライズ向け生成 AI の利用を拡大 | Google Cloud 公式ブログ
- 4 users
- cloud.google.com
- テクノロジー
- 2023/07/30
※この投稿は米国時間 2023 年 7 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。生成 AI の開発は猛烈な勢いで続いており、この破壊的技術を活かせるようなエンタープライズ向け機能を利用できるかどうかがかつてなく重要となっています。 Google の数十年に及ぶ調査とイノベーション、そして AI への投資を活用することで、Google Cloud は常に、セキュリティとデータガバナンス、そして全体的なスケーラビリティが用意されている状態で生成 AI を利用できるようにしています。この目的のため、先月 Google は Vertex AI での生成 AI サポートの一般提供を発表しました。これにより Google Research から優れた基盤モデルにアクセス可能となり、これらのモデルをカスタマイズして利用するためのツールも利用できるようになりま
- google
- あとで読む
ピンタレストが日本で急成長　Z世代にユーザー層拡大 - 日本経済新聞
- 4 users
- www.nikkei.com
- 世の中
- 2024/10/14
「Pinterest（ピンタレスト）」は、日本でユーザー数が1050万人を突破し、成長中のビジュアル探索型プラットフォーム。2022年6月からは、日本で広告事業を開始。ピンタレストというプラットフォームにはどのような特長があり、どのような企業が利用しているのか。ピンタレスト・ジャパン（東京・渋谷）の成田敬カントリーマネージャーと、初来日した米ピンタレストのビル・レディー最高経営責任者（CEO）が
- ad
7月新刊情報『コンピュータビジョンのための実践機械学習』
- 4 users
- www.oreilly.co.jp
- テクノロジー
- 2023/06/22
『コンピュータビジョンのための実践機械学習 ―モデルアーキテクチャからMLOpsまで』 Valliappa Lakshmanan、Martin Gorner、Ryan Gillard　著、大山匠　監訳、松田晃一　訳 2023年7月19日発売予定 512ページ（予定） ISBN978-4-8144-0038-6 定価4,620円（税込）機械学習モデルを使用して画像に関するさまざまな課題を解くための実践的な解説書。コンピュータビジョンは機械学習で最も注目度の高い分野のひとつです。本書では、機械学習エンジニアやデータサイエンティストを対象に、コンピュータビジョンに関連する機械学習の手法、アーキテクチャ、課題、運用などを網羅的に解説します。読者は、分類、物体検出、セグメンテーション、異常検知、画像生成、キャプション生成といった画像関連の問題を、機械学習で解決する方法を学びます。また、データセ
GitHub - open-mmlab/mmfashion: Open-source toolbox for visual fashion analysis based on PyTorch
- 4 users
- github.com/open-mmlab
- テクノロジー
- 2020/11/19
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- oss
- fashion