並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 216件

新着順 人気順

"3D Reconstruction"の検索結果1 - 40 件 / 216件

  • Raytrix | 3D light field camera technology

    Super Resolution 3D Pleno Light-Field Machine Vision | Monocular RGB-Depth Snapshot Sensor | Realtime Plenoptic AI Metrology nvidia RTX 4090 Ada Lovelace Support PCB Deep Hole Depth Inspection Computer Vision 32x32 On-Chip Lens Solution Inline Computational Imaging Computational Photography Shack-Hartmann Sensor 3D Printing Solder Paste Inspection Bonding Wire Inspection Pin Connector Inspection O

    • 無料で写真から3Dプリント出力可能なモデルを生成できるオープンソースの3D再構築ソフト「Meshroom」

      3D再構成とカメラ追跡アルゴリズムを提供するフォトグラメトリフレームワークのAliceVisionに基づくオープンソースの3D再構成ソフトが「Meshroom」です。MeshroomはWindowsとLinux向けにリリースされており、無料でインストールすることができます。 AliceVision | Meshroom - 3D Reconstruction Software https://alicevision.org/#meshroom Meshroomがどんなソフトなのかは以下のムービーを見ればよくわかります。 Photogrammetry 2 – 3D scanning with just PHONE/CAMERA simpler, better than ever! - YouTube Meshroomは複数の大学やラボの協力によって開発された、フォトグラメトリソフトウェアです

        無料で写真から3Dプリント出力可能なモデルを生成できるオープンソースの3D再構築ソフト「Meshroom」
      • opencv.jp - OpenCV-1.0 リファレンス マニュアル(日本語訳)-

        最終変更者: 怡土順一, 最終変更リビジョン: 467, 最終変更日時: 2009-06-23 14:23:34 +0900 (火, 23 6月 2009) CXCORE リファレンス マニュアル 基本構造体(Basic Structures) 配列操作(Operations on Arrays) 初期化(Initialization) 要素へのアクセスと部分配列(Accessing Elements and sub-Arrays) コピーと充填(Copying and Filling) 変形と置換(Transforms and Permutations) 四則演算,論理演算,比較演算(Arithmetic, Logic and Comparison) 統計(Statistics) 線形代数(Linear Algebra) 数学関数(Math Functions) 乱数生成(Random

        • Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog

          2.3k{icon} {views} 複数のLLM(GPT/Claude3)とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題(TSP)が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。 できたもの Arxivの検索APIを使って検索拡張生成(RAG)したらサーベイを自動生成できた やっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題(TSP)を解いてソートをかける 論文の要旨をGPT-3.5-Turboで要約 ソートした

            Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
          • これはすごい!一枚の顔写真から自分の顔の3Dモデルが作れるサービス「Vizago」 - Chrome Life

            最近は、3Dネタの記事が多くなってきましたが、気にしないでくださいねw もちろん今回も3Dネタなのですが、めちゃくちゃスゴイです! 一枚の顔写真から高品質な3Dモデルが作れる! このテクノロジーを開発したのが、ヨーロッパの会社「Vizago」です。 Vizagoが持っている特許モーフィングモデルテクノロジーは、単一ユーザーの写真から3D面を作成することができます。 これは、専用のスキャナハードウェアを使用せずにバーチャルキャラクターを作成することができる画期的な技術です。 Vizago - 3D faces from a single image どれほど簡単に3Dモデルが作れるか試してみましょう。 Vizagoデモにブラウザでアクセスし、loginのリンクをクリックします。 facebookアカウントでログインします。 ログイン後に、3D Reconstructionをクリックします。

            • opencv.jp - OpenCV-1.0 リファレンス マニュアル(日本語訳)-

              最終変更者: 怡土順一, 最終変更リビジョン: 467, 最終変更日時: 2009-06-23 14:23:34 +0900 (火, 23 6月 2009) CXCORE リファレンス マニュアル 基本構造体(Basic Structures) 配列操作(Operations on Arrays) 初期化(Initialization) 要素へのアクセスと部分配列(Accessing Elements and sub-Arrays) コピーと充填(Copying and Filling) 変形と置換(Transforms and Permutations) 四則演算,論理演算,比較演算(Arithmetic, Logic and Comparison) 統計(Statistics) 線形代数(Linear Algebra) 数学関数(Math Functions) 乱数生成(Random

              • Interactive Visual Media - Microsoft Research

                Overview The Interactive Visual Media group conducts state-of-the-art research in a variety of topics related to computer vision, computer graphics and computational photography. Our goal is to develop new applications for manipulation, reasoning and communication with visual media. Core areas of research include: 3D reconstruction and image segmentation object recognition image and video enhancem

                  Interactive Visual Media - Microsoft Research
                • OpenCV - Wikipedia

                  OpenCV(オープンシーヴィ、英: Open Source Computer Vision Library)とはインテルが開発・公開したオープンソースのコンピュータビジョン向けライブラリ[4]。2009年にWillow Garage(ウィロー・ガレージ)に開発が移管され、さらにその後Itseezにメンテナンスが移管された[5]が、2016年5月にインテルがItseezを買収することが発表された[6][7]。 概要[編集] 画像処理・画像解析および機械学習等の機能を持つC++、Java、Python、MATLAB用ライブラリ[8]。様々なプラットフォームすなわち複数のオペレーティングシステム (OS) やCPUアーキテクチャに対応するクロスプラットフォームなライブラリであり、macOSやFreeBSD等全てのPOSIXに準拠したUnix系OS、Linux、Windows、Android、i

                    OpenCV - Wikipedia
                  • 必見「OpenCV-Python Tutorials」 - Qiita

                    「OpenCV-Python チュートリアル文書」 のサイトが立ち上がっています。 OpenCV-Python チュートリアル文書のページへようこそ! まとまった訳を読むためには、上記のサイトをご利用ください。 以下の訳は、訳として不十分であり、関連するpythonのライブラリとの比較をした部分に独自性がある程度の代物です。 OpenCV3.2のOpenCV-Python Tutorials が http://docs.opencv.org/3.2.0/d9/df8/tutorial_root.html で公開されています。 (最近はGoogle翻訳の精度も上がっているので、この記事を読むよりは、Google翻訳にかけてみれば十分かもしれません。) OpenCV3.1のOpenCV-Python Tutorials が http://docs.opencv.org/3.1.0/d6/d00

                      必見「OpenCV-Python Tutorials」 - Qiita
                    • Kaggle上位ランカーの5人に聞いた、2019年面白かったコンペ12選と論文7選 | 宙畑

                      2019年も様々なデータサイエンス関連のコンペが実施され、論文が発表されました。その中でも面白かったものはどれか、5人のkagglerの方に直接お伺いしました。 2019年はTellusxSIGNATEで実施された衛星データコンペの解説(第1回・第2回)が、データサイエンティストの方に読んでいただいた宙畑のヒット記事としてランクイン。 では、データサイエンティストの方は他にどのようなコンペや論文に興味を持たれていたのか……と気になった宙畑編集部。 今回、以下5名のKagglerの方に協力いただき、2019年の振り返りとして面白かったコンペと論文、そしてその理由を教えていただきました。 あきやま様(@ak_iyama) jsato様(@synapse_r) Hiroki Yamamoto様(@tereka114) smly様(@smly) ※順不同 ※1名、非公表 Kaggleについては「世

                        Kaggle上位ランカーの5人に聞いた、2019年面白かったコンペ12選と論文7選 | 宙畑
                      • Welcome - OpenCV Wiki

                        Other Languages : Chinese(中文) Welcome to the OpenCV Wiki This Wiki is intended to support the OpenCV community. The main objective is to share experiences and improve the documentation. Feel free to contribute to it. (Note: if you want more information about WikiWikiWeb systems, look at HelpContents) Started on 14 Feb 2006. Moved to hosting at Willow Garage 27 Oct 2008. Page Contents Introduction

                        • 3Dで再現した恐ろしくリアルな古代ローマの町並みを体験できる「Rome in 3D」

                          「当時ローマに住んでいた人の目線で古代ローマを見ることができるようにする」という目標を掲げ、素材・色・天気・視覚効果にまでこだわって古代ローマの町並みを3Dで再現したプロジェクトが「Rome in 3D」です。Rome in 3Dではいくつものムービーが公開されており、現代の遺跡の姿とは全く違う、リアルな古代ローマをまざまざと体験することが可能です。 Rome in 3D - History in 3D https://relivehistoryin3d.com/projects/rome-in-3d/ Rome in 3Dで公開されているムービーは、以下から見ることができます。 "HISTORY IN 3D" - ANCIENT ROME 320 AD - 3rd trailer "Walking around Colosseum" - YouTube 紀元後320年ごろのローマの町並み

                            3Dで再現した恐ろしくリアルな古代ローマの町並みを体験できる「Rome in 3D」
                          • OpenCV

                            作成者: 怡土順一, 最終変更者: 小枝正直, 最終変更リビジョン: 481, 最終変更日時: 2009-08-13 20:02:03 +0900 (木, 13 8月 2009) CXCORE サンプルコード 基本構造体(Basic Structures) 配列操作(Operations on Arrays) 初期化(Initialization) コピーと充填(Copying and Filling) 変形と置換(Transforms and Permutations) 線形代数(Linear Algebra) 離散変換(Discrete Transforms) 動的構造体(Dynamic Structures) 木(Trees) 描画関数(Drawing Functions) 曲線と形状(Curves and Shapes) テキスト(Text) データ永続性と実行時型情報(Data

                            • 湖上に作られたアステカの首都「テノチティトラン」の詳細な3D画像が公開される、人口20万超の壮大な水上都市はどんな姿だったのか?

                              15世紀~16世紀にかけて現代のメキシコ中央部で栄えたアステカの首都・テノチティトランは、かつてメキシコ盆地に南北約65kmにわたり広がっていたテスココ湖の上に建設された壮大な都市でした。現代ではテスココ湖のほとんどが埋め立てられ、メキシコの首都であるメキシコシティが建設されていて、かつてのテノチティトランの面影はどこにもありません。テクニカルアーティストのトーマス・コール氏は、このテノチティトランを3Dで再現した詳細な画像を公開しました。 A Portrait of Tenochtitlan • 3D reconstruction of the capital of the Aztec empire. https://tenochtitlan.thomaskole.nl/index.html 1428年から1521年まで栄えたアステカはメシカ・アコルワ・テパネカという3集団の同盟で支配さ

                                湖上に作られたアステカの首都「テノチティトラン」の詳細な3D画像が公開される、人口20万超の壮大な水上都市はどんな姿だったのか?
                              • OpenPoseがどんどんバージョンアップして3d pose estimationも試せるようになっている - izm_11's blog

                                概要 今年のゴールデンウイークに公開されたCMUのOpenPoseはその推定精度の高さと、(Ubuntuなら)気軽に試せる依存ライブラリの少なさ、結果の分かりやすさから多くのサイトで話題になりました。 github.com OpenPoseで踊ってみた動画からポーズ推定。 試しに動かしてみました。腕をクロスさせたときとかの遮蔽に対してかなり強いです。動画解像度とfpsが高いほど有効そうです。 Geforce GTX1060 Ubuntu16.04 pic.twitter.com/1GKfBmTXdo— izm (@izm) 2017年5月7日 このエントリは、このOpenPoseについての最近(-2017/7)の情報をまとめておく、という備忘録的な意図です。 手と顔の推定が正式追加 WindowsBuildが実用的に動く 骨格の3次元座標が(セッティングすれば)取れる 商用ライセンスが正式

                                  OpenPoseがどんどんバージョンアップして3d pose estimationも試せるようになっている - izm_11's blog
                                • interior

                                  Abstract This paper proposes a fully automated 3D reconstruction and visualization system for architectural scenes (interiors and exteriors). The reconstruction of indoor environments from photographs is particularly challenging due to texture-poor planar surfaces such as uniformly-painted walls. Our system first uses structure-from-motion, multi-view stereo, and a stereo algorithm specifically de

                                  • Awesome CS Courses

                                    Awesome CS Courses Introduction There are a lot of ~~hidden~~ treasures lying within university pages scattered across the internet. This list is an attempt to bring to light those awesome CS courses which make their high-quality materials, i.e. assignments, lectures, notes, readings and examinations, available online for free. Table of Contents Algorithms Artificial Intelligence Computer Graphics

                                    • 都市景観をスキャンし3Dモデル構築する予想外の方法とは? - A Successful Failure

                                      建物群から構成される都市景観の3Dモデリングは、様々なアプリケーションにおいて利用されているが、その利用は現時点では限定されており、より積極的な利用を促進するには、3Dモデル構築の省力化、自動化、低コスト化が求められる。最近、ジョージア工科大の研究グループが、都市景観をスキャンし、3Dモデル構築を行うあっと驚く意外な方法を考案している。本エントリでは、論文*1に従って、この手法の概要と、それによって将来可能になるであろうユースシーンについて紹介したい。本エントリで掲載する図表は本論文からの引用である。 【告知】@LunarModule7でつぶやいています。 興味のあるかたはフォローください。 GPSを使って街をスキャンする GPSは30個程度の衛星のうち受信可能な位置にある衛星からの時刻情報、軌道情報などを受信し、衛星からの距離を測定、3次元位置を測位するものだ。4個のGPS衛星からの電波

                                        都市景観をスキャンし3Dモデル構築する予想外の方法とは? - A Successful Failure
                                      • A Year in Computer Vision

                                        A Year in Computer Vision Edited for The M Tank by Benjamin F. Duffy & Daniel R. Flynn The M Tank Also on Medium: Part 1, Part 2, Part 3, Part 4 Introduction Computer Vision typically refers to the scientific discipline of giving machines the ability of sight, or perhaps more colourfully, enabling machines to visually analyse their environments and the stimuli within them. This process typically i

                                        • コンピュータビジョン分野における世界最高峰の国際会議CVPR2022の論文紹介(後編) - NTT Communications Engineers' Blog

                                          目次 目次 はじめに 論文紹介 The Norm Must Go On: Dynamic Unsupervised Domain Adaptation by Normalization OcclusionFusion: Occlusion-aware Motion Estimation for Real-time Dynamic 3D Reconstruction EPro-PnP: Generalized End-to-End Probabilistic Perspective-N-Points for Monocular Object Pose Estimation Cascade Transformers for End-to-End Person Search TrackFormer: Multi-Object Tracking With Transformers Global T

                                            コンピュータビジョン分野における世界最高峰の国際会議CVPR2022の論文紹介(後編) - NTT Communications Engineers' Blog
                                          • Bundler - Structure from Motion for Unordered Image Collections

                                            Bundler: Structure from Motion (SfM) for Unordered Image Collections Software written by Noah Snavely Download Bundler from the bundler_sfm repository on GitHub | What is Bundler? | Downloading Bundler | Documentation | References | Links | What is Bundler? Bundler is a structure-from-motion (SfM) system for unordered image collections (for instance, images from the Internet) written in C and C++.

                                            • Oculus入りしたKinect Fusion開発者の論文を流し読み | Scene Research Station

                                              先日Oculusに買収されjoinしたRichard Newcombe氏らの論文を5つほど流し読みしましたので、適当な解説を加えて紹介します。 https://www.oculus.com/blog/announcing-the-acquisition-of-surreal-vision DTAM: 単眼カメラでリアルタイムに3次元再構成 (2011年) http://www.youtube.com/watch?v=Df9WhgibCQA DTAM: Dense Tracking and Mapping in Real-Time http://www.doc.ic.ac.uk/~ajd/Publications/newcombe_etal_iccv2011.pdf DTAMの前にその全身となるPTAMについて。PTAMはいわゆるマーカーレスで自己位置推定をやる手法。画面上に特徴点を大量に見

                                              • 100+ Best GitHub Repositories For Machine Learning

                                                There are millions of github repos and filtering them is an insane amount of work. It takes huge time, efforts and a lot more. We have done this for you. In this article we’ll share a curated list of 100+ widely-known, recommended and most popular repositories and open source github projects for Machine Learning and Deep Learning. So without further ado, Let’s see all the hubs created by experts a

                                                  100+ Best GitHub Repositories For Machine Learning
                                                • 情報系主要国際会議2013のチュートリアルまとめ2: コンピュータビジョン、自然言語処理、信号処理 | ぱろすけのメモ帳

                                                  情報系の国際学会の多くでは、研究発表に加えてチュートリアル・セッションが設けられています。チュートリアルではホットなテーマの基礎から応用までが扱われ、要点を絞ってわかりやすく解説されており、初心者の入門には最適です。 学会に参加してチュートリアルを受けなくても、多くの場合はその内容を知ることができます。その概要は必ず会議のプログラムに掲載されますし、発表者がスライドを Web にアップロードすることも多く、発表の様子がビデオ配信されることもあります。 オンラインに情報があることは多いとはいえ、それらは基本的には分散しています。会議のウェブサイトにはチュートリアル一覧が載っています。しかし、そこから発表者によるチュートリアルサイトにリンクが貼られていることは少なく、スライドの情報もないことが多い。これは非常に不便です。c というわけで、2013年の情報系主要国際会議で行われたチュートリアルの

                                                    情報系主要国際会議2013のチュートリアルまとめ2: コンピュータビジョン、自然言語処理、信号処理 | ぱろすけのメモ帳
                                                  • コンピュータビジョン分野における世界最高峰の国際会議CVPR2022からワークショップの模様を紹介(前編) - NTT Communications Engineers' Blog

                                                    目次 目次 はじめに CVPR2022概要 Workshop on Image Matching: Local Features & Beyond SuperPoint and SuperGlue: Lessons Learned Large-scale 3D reconstruction Deployment - Successes, Challenges, Open Problems Unstructured Object Matching using Co-Salient Region Segmentation Nerfels: Renderable Neural Codes for Improved Camera Pose Estimation Feature Query Networks: Neural Surface Description for Camera Pose Re

                                                      コンピュータビジョン分野における世界最高峰の国際会議CVPR2022からワークショップの模様を紹介(前編) - NTT Communications Engineers' Blog
                                                    • The GAN Zoo

                                                      Pretty painting is always better than a TerminatorEvery week, new papers on Generative Adversarial Networks (GAN) are coming out and it’s hard to keep track of them all, not to mention the incredibly creative ways in which researchers are naming these GANs! You can read more about GANs in this Generative Models post by OpenAI or this overview tutorial in KDNuggets. Explosive growth — All the named

                                                        The GAN Zoo
                                                      • AliceVision | Photogrammetric Computer Vision Framework

                                                        AliceVision is a Photogrammetric Computer Vision framework for 3D Reconstruction and Camera Tracking.

                                                        • Here are 850+ Ivy League Courses You Can Take Right Now for Free

                                                          The 8 Ivy League schools are among the most prestigious universities in the world. They consist of Harvard, Yale, Princeton, Columbia, Cornell, Dartmouth, Brown, and the University of Pennsylvania. In 2023, all 8 Ivy League schools are ranked in the top-20 of the U.S. News & World Report national university ranking. As you'd imagine, these institutions are highly selective and very hard to get int

                                                            Here are 850+ Ivy League Courses You Can Take Right Now for Free
                                                          • Neural 3D Mesh Renderer | Hiroharu Kato

                                                            These applications are realized by redefining the “backward pass” of a 3D mesh renderer and incorporating it into neural networks. Short introduction We propose Neural Renderer. This is a 3D mesh renderer and able to be integrated into neural networks. We applied this renderer to (a) 3D mesh reconstruction from a single image and (b) 2D-to-3D image style transfer and 3D DeepDream. Abstract For mod

                                                            • digilab homepage

                                                              Voodoo Camera Tracker: A tool for the integration of virtual and real scenes Version 0.9.4 beta for Linux and Windows Copyright (C) 2002-2007 Laboratorium für Informationstechnologie This non-commercial software tool is developed for research purpose at the Laboratorium für Informationstechnologie, University of Hannover. Permission is granted to any individual or institution to use, copy, and di

                                                              • VisualSFM : A Visual Structure from Motion System

                                                                VisualSFM is a GUI application for 3D reconstruction using structure from motion (SFM). The reconstruction system integrates several of my previous projects: SIFT on GPU(SiftGPU), Multicore Bundle Adjustment, and Towards Linear-time Incremental Structure from Motion. VisualSFM runs fast by exploiting multicore parallelism for feature detection, feature matching, and bundle adjustment. For dense re

                                                                  VisualSFM : A Visual Structure from Motion System
                                                                • Computer Vision Source Code

                                                                  before a link means the link points to a binary file, not a readable page) Research Code A rational methodology for lossy compression - REWIC is a software-based implementation of a a rational system for progressive transmission which, in absence of a priori knowledge about regions of interest, choose at any truncation time among alternative trees for further transmission. To circumvent the lack o

                                                                  • Building Rome in a Day

                                                                    Entering the search term Rome on Flickr returns more than two million photographs. This collection represents an increasingly complete photographic record of the city, capturing every popular site, facade, interior, fountain, sculpture, painting, cafe, and so forth. It also offers us an unprecedented opportunity to richly capture, explore and study the three dimensional shape of the city. In this

                                                                    • PMVS2

                                                                      PMVS is a multi-view stereo software that takes a set of images and camera parameters, then reconstructs 3D structure of an object or a scene visible in the images. Only rigid structure is reconstructed, in other words, the software automatically ignores non-rigid objects such as pedestrians in front of a building. The software outputs a set of oriented points instead of a polygonal (or a mesh) mo

                                                                      • opencv.jp - OpenCV サンプルコード -

                                                                        作成者: 怡土順一, 最終変更者: 小枝正直, 最終変更リビジョン: 481, 最終変更日時: 2009-08-13 20:02:03 +0900 (木, 13 8月 2009) CXCORE サンプルコード 基本構造体(Basic Structures) 配列操作(Operations on Arrays) 初期化(Initialization) コピーと充填(Copying and Filling) 変形と置換(Transforms and Permutations) 線形代数(Linear Algebra) 離散変換(Discrete Transforms) 動的構造体(Dynamic Structures) 木(Trees) 描画関数(Drawing Functions) 曲線と形状(Curves and Shapes) テキスト(Text) データ永続性と実行時型情報(Data

                                                                        • Ron Fedkiw

                                                                          Ron Fedkiw Canon Professor Stanford Computer Science Ph.D. Applied Mathematics, UCLA LEFT PHOTO: circa 2005; RIGHT PHOTO: circa 2017 Computer Science Department Stanford University Gates Computer Science Bldg., Room 310 Stanford, CA 94305-9020 fedkiw@cs.stanford.edu CS205L: Continuous Mathematical Methods with an Emphasis on Machine Learning A survey of numerical approaches to the continuous mathe

                                                                          • The Future of Real-Time SLAM and Deep Learning vs SLAM

                                                                            Last month's International Conference of Computer Vision (ICCV) was full of Deep Learning techniques, but before we declare an all-out ConvNet victory, let's see how the other "non-learning" geometric side of computer vision is doing.  Simultaneous Localization and Mapping, or SLAM, is arguably one of the most important algorithms in Robotics, with pioneering work done by both computer vision and

                                                                              The Future of Real-Time SLAM and Deep Learning vs SLAM
                                                                            • Welcome - OpenCV Wiki

                                                                              Other Languages : Chinese(中文) Welcome to the OpenCV Wiki This Wiki is intended to support the OpenCV community. The main objective is to share experiences and improve the documentation. Feel free to contribute to it. (Note: if you want more information about WikiWikiWeb systems, look at HelpContents) Started on 14 Feb 2006. Moved to hosting at Willow Garage 27 Oct 2008. Page Contents Introduction

                                                                              • 2023年上期のメディアAI PJ勉強会資料を公開 - NTT Communications Engineers' Blog

                                                                                こんにちは、イノベーションセンターのメディアAI プロジェクト(以下、PJ)の小林です。普段はコンピュータビジョンの技術開発やAI/機械学習(ML)システムの検証に取り組んでいます。 我々メディアAI PJでは技術力の向上および業務で得られた知見の共有のために毎週チーム内で勉強会を行っています。本記事では2023年の上期に開催した勉強会の概要と勉強会で発表された資料をSpeaker Deckで公開したので紹介したいと思います。 目次 目次 メディアAI PJの紹介 メディアAI PJ勉強会の概要 2023年上期で発表された資料公開 おわりに メディアAI PJの紹介 最初に私たちメディアAI PJについて簡単に紹介したいと思います。メディアAI PJは名前の通り、画像・動画・3D・音声・言語1などのメディアに関連するAIの技術開発をメインに行っているチームです。事業部から来る技術相談を通し

                                                                                  2023年上期のメディアAI PJ勉強会資料を公開 - NTT Communications Engineers' Blog
                                                                                • CVPR 2011 papers on the web - Papers

                                                                                  If you have additions or changes, send an e-mail (remove the "nospam"). This material is presented to ensure timely dissemination of scholarly and technical work. Copyright and all rights therein are retained by authors or by other copyright holders. All persons copying this information are expected to adhere to the terms and constraints invoked by each authors copyright. Paper Awards [Best Paper]