arxiv_readerのブックマーク / 2022年5月17日 - はてなブックマーク

arxiv_reader id:arxiv_reader

2022年5月17日のブックマーク (134件)

Guess What Moves: 動きを予測することによる教師なしビデオと画像のセグメンテーション
arxiv_reader 2022/05/17
オプティカルフローを介して測定されるモーションは、画像やビデオ内のオブジェクトを発見して学習するための強力な手がかりを提供します。ただし、外観を使用する場合と比較すると、オブジェクトが動かないと見えな

video

unsupervised

arXiv

optical flow

learning

benchmark

segmentation

arXiv reaDer
リンク
ディープスペクトル法：教師なしセマンティックセグメンテーションとローカリゼーションの驚くほど強力なベースライン
arxiv_reader 2022/05/17
教師なしローカリゼーションとセグメンテーションは、ラベル付けされたデータなしで画像を意味的に意味のあるセグメントに分解することを含む、長年のコンピュータビジョンの課題です。これらのタスクは、密な画像注

unsupervised

arXiv

computer vision

affinity

localization

dataset

semantic segmentation

clustering

self-supervised

arXiv reaDer
リンク
食品科学および産業のための知識グラフの応用
arxiv_reader 2022/05/17
さまざまなネットワーク（例：Internet of Things [IoT]およびモバイルネットワーク）、データベース（例：栄養表および食品組成データベース）、およびソーシャルメディア（例：Insta

arXiv

human

arXiv reaDer
リンク
HerosNet：スナップショット圧縮イメージングのためのハイパースペクトルの説明可能な再構成と最適なサンプリングディープネットワーク
arxiv_reader 2022/05/17
ハイパースペクトルイメージングは、特にリモートセンシング、農業、および医療における幅広いアプリケーションに不可欠なイメージングモダリティです。低速、高価、またはかさばる既存のハイパースペクトルカメラに

reconstruction

arXiv

dataset

gradient

attention

arXiv reaDer

simulation
リンク
ZeroWasteデータセット：雑然としたシーンでの変形可能なオブジェクトのセグメンテーションに向けて
arxiv_reader 2022/05/17
米国ではリサイクル可能な廃棄物の35％未満が実際にリサイクルされており、これは土壌や海洋の汚染の増加につながり、環境研究者や一般市民の主要な関心事の1つです。問題の中心にあるのは、廃棄物の流れが非常に

arXiv

computer vision

dataset

domain

semantic segmentation

pose

arXiv reaDer

detection
リンク
単一のRGB画像からのパノプティコン3Dシーンの再構成
arxiv_reader 2022/05/17
単一の画像から3Dシーンを理解することは、ロボット工学、動作計画、拡張現実など、さまざまなタスクの基本です。単一のRGB画像からの3D知覚における既存の作品は、幾何学的再構成のみ、またはセマンティック

reconstruction

arXiv

augmentation

3D

semantic segmentation

panoptic segmentation

representation

arXiv reaDer
リンク
CLIP-TD：視覚言語タスクのためのCLIPターゲット蒸留
arxiv_reader 2022/05/17
対照的な言語画像事前トレーニング（CLIP）は、視覚と言語モダリティを統合された埋め込みスペースにリンクし、視覚言語（VL）タスクの大きな可能性を生み出します。初期の並行作業では、タスクのサブセットで

arXiv

VQA

reasoning

domain

embedding

contrastive

arXiv reaDer

distillation
リンク
FvOR：数ビューのオブジェクト再構成のためのロバストな関節形状とポーズの最適化
arxiv_reader 2022/05/17
いくつかの画像観測から正確な3Dオブジェクトモデルを再構築することは、コンピュータビジョンにおける挑戦的な問題のままです。最先端のアプローチでは、通常、入力として正確なカメラポーズを想定していますが、

reconstruction

arXiv

computer vision

3D

benchmark

pose estimation

arXiv reaDer
リンク
農業モニタリングのための大きな衛星画像時系列のデータキューブ
arxiv_reader 2022/05/17
共通農業政策（CAP）の近代化には、農地の大規模かつ頻繁な監視が必要です。この方向に向けて、無料でオープンな衛星データ（つまり、センチネルミッション）は、必要な高空間および時間分解能の地球観測のソース

arXiv

learning

synthesis

satellite

arXiv reaDer
リンク
ARTEMIS：テキスト明示的マッチングと暗黙的類似性を備えた注意ベースの検索
arxiv_reader 2022/05/17
画像を検索する直感的な方法は、サンプル画像と補足テキストで構成されるクエリを使用することです。前者は検索に豊富で暗黙的なコンテキストを提供しますが、後者は明示的に新しい特性を要求するか、目的のターゲッ

arXiv

pre-training

benchmark

representation

attention

arXiv reaDer
リンク
生の3D点群の可変レート圧縮
arxiv_reader 2022/05/17
この論文では、生の3D点群データを操作する新しい可変レートの深層圧縮アーキテクチャを提案します。学習ベースの点群圧縮方法の大部分は、データのダウンサンプリングされた表現で機能します。さらに、多くの既存

arXiv

3D

compression

representation

arXiv reaDer

point cloud
リンク
解釈可能な機械学習を使用した害虫の存在予測
arxiv_reader 2022/05/17
Helicoverpa Armigera、またはオオタバコガは、綿花の深刻な害虫であり、リントの収量と品質を脅かします。農場での効果的な介入には、野外での昆虫の存在に関するタイムリーな知識が不可欠です

explainable

arXiv

arXiv reaDer

learning
リンク
農業モニタリングのための宇宙から地上へのデータの可用性に向けて
arxiv_reader 2022/05/17
機械学習の最近の進歩と、空間的および時間的解像度の高い広い領域をカバーする無料でオープンな大規模な地球データ（Sentinelミッションなど）の可用性により、多くの農業監視アプリケーションが可能になり

arXiv

dataset

learning

domain

satellite

arXiv reaDer

classification
リンク
自動運転における3Dオブジェクト検出のための多様性ベースのアクティブラーニングの調査
arxiv_reader 2022/05/17
3Dオブジェクト検出は、自動運転車（AV）での大きな可能性により、最近大きな注目を集めています。ディープラーニングベースのオブジェクト検出器の成功は、大規模な注釈付きデータセットの可用性に依存していま

vehicle

autonomous driving

arXiv

dataset

3D

benchmark

attention

human

arXiv reaDer

detection
リンク
hls4mlを使用した自動運転車用のFPGAでのリアルタイムセマンティックセグメンテーション
arxiv_reader 2022/05/17
この論文では、フィールドプログラマブルゲートアレイが自動運転に関連するリアルタイムセマンティックセグメンテーションタスクのハードウェアアクセラレータとしてどのように機能するかを調査します。 ENet畳

autonomous driving

arXiv

dataset

semantic segmentation

real time

vehicle

CNN

arXiv reaDer
リンク
同意：太字の単語分類のためのコンテキストセンシティブトランスフォーマー
arxiv_reader 2022/05/17
完全にトレーニング可能なエンドツーエンドの深層学習パイプライン内でコンテキスト依存のオブジェクト分類を行うための、シンプルでありながら効果的なCONtextSENsitiveTransformerフレ

arXiv

learning

pose

transformer

arXiv reaDer

classification

detection
リンク
VQBB：ベクトル量子化ブラウン橋を使用した画像から画像への変換
arxiv_reader 2022/05/17
画像から画像への変換は、コンピュータビジョンにおける重要で困難な問題です。 Pixel2Pixel、DualGANなどの既存のアプローチは、GANの不安定性に悩まされており、タスクを1対1のマッピング

GAN

arXiv

computer vision

quantization

learning

domain

arXiv reaDer
リンク
PUCK：イベントベースのカメラの平行表面および畳み込みカーネル追跡
arxiv_reader 2022/05/17
低遅延と精度は、システムの信頼性と安定性に影響を与えるため、ターゲットとの高速対話のためにビジョンがロボットに統合されている場合の基本的な要件です。このようなシナリオでは、センサーとアルゴリズムの選択

arXiv

robot

benchmark

representation

convolutional

tracking

arXiv reaDer
リンク
自己監視によるスケーラブルな車両の再識別
arxiv_reader 2022/05/17
コンピュータービジョンテクノロジーが高度道路交通アプリケーション向けに成熟するにつれ、大規模でリアルタイムの展開にどれほど効率的でスケーラブルかを尋ねる時が来ました。これらのテクノロジーの中には、都市

arXiv

computer vision

benchmark

real time

re-id

self-supervised

vehicle

arXiv reaDer
リンク
https://arxiv-check-250201.firebaseapp.com/each/2205.07611v3
arxiv_reader 2022/05/17
最近、ビデオ認識は、モデルのパフォーマンスまたは堅牢性を向上させるために複数のモダリティを統合することに焦点を当てたマルチモーダル学習の助けを借りて出現しています。さまざまなマルチモーダル学習方法が提

video

arXiv

metric

dataset

estimation

learning

synthesis

contrastive

action recognition

arXiv reaDer
リンク
ソーシャルメディアにおける感情表現のための画像とテキストの相補性について
arxiv_reader 2022/05/17
ソーシャルメディアの投稿の作成者は、自分の感情とその原因をテキストや画像で伝えます。各モダリティの感情と刺激の検出に関する作業は個別に行われていますが、モダリティにソーシャルメディアの補完的な感情情報

arXiv

emotion

person

arXiv reaDer

detection
リンク
アトラスベースの胎児および新生児の脳のセグメンテーションと分析のための自動パイプライン
arxiv_reader 2022/05/17
磁気共鳴画像法（MRI）における周産期の脳構造の自動セグメンテーションは、脳の成長と関連する合併症の研究にとって最も重要です。成人と小児のMRIデータにはさまざまな方法がありますが、周産期の画像を分析

arXiv

MRI

human

segmentation

arXiv reaDer
リンク
脊椎の弱く監視された生体力学的に制約されたCT/MRI登録
arxiv_reader 2022/05/17
CTとMRIは、脊椎の診断と治療計画において最も有益な2つのモダリティです。 CTは骨の構造を分析するときに役立ちますが、MRIは軟組織に関する情報を提供します。したがって、両方のモダリティの情報を融

arXiv

dataset

CT

weakly-supervised

learning

MRI

segmentation

arXiv reaDer
リンク
BERTHA：転送で学習した人間の評価によるビデオキャプションの評価
arxiv_reader 2022/05/17
ビデオキャプションシステムの評価は、考慮すべき要素が複数あるため、困難な作業です。たとえば、キャプションの流暢さ、1つのシーンで発生する複数のアクション、重要と見なされるものに対する人間の偏見などです

video

arXiv

metric

BERT

dataset

bias

action

human

arXiv reaDer

captioning
リンク
ラグランジアン緩和における凸共役の持ち上げ：連続マルコフ確率場のための実行可能なアプローチ
arxiv_reader 2022/05/17
非凸最適化における二重分解アプローチは、双対性のギャップに悩まされる可能性があります。これは、連続状態空間を持つマルコフ確率場（MRF）でのMAP推論など、非凸問題に直接適用する場合に課題となります。

arXiv

stereo

bias

pose

arXiv reaDer
リンク
RSNA頭蓋内出血検出競争のための効果的な変圧器ベースのソリューション
arxiv_reader 2022/05/17
RSNA-IHDコンペティション（2019）の勝者ソリューションのパフォーマンスを超える頭蓋内出血検出（IHD）の効果的な方法を提示します。一方、私たちのモデルは、勝者のソリューションと比較して、4分

semi-supervised

arXiv

computer vision

CT

LSTM

convolutional

arXiv reaDer

detection
リンク
視覚的な質問応答のためのニューロシンボリックASPパイプライン
arxiv_reader 2022/05/17
CLEVRのニューロシンボリックビジュアル質問応答（VQA）パイプラインを紹介します。これは、オブジェクトとそれに関連する質問を含むシーンを示す写真で構成されるよく知られたデータセットです。私たちのパ

arXiv

dataset

VQA

arXiv reaDer

classification
リンク
SQ-VAE：自己アニーリングされた確率的量子化による離散表現の変分ベイズ
SQ-VAE: Variational Bayes on Discrete Representation with Self-annealed Stochastic Quantization ベクトル量子化変分オートエンコーダー（VQ-VAE）の注目すべき問題の1つは、学習された離散表現がコードブックの全容量のごく一部しか使用しないことです。これはコードブックの崩壊としても知られています。慎重に設計されたヒューリスティックを含むVQ-VAEのトレーニングスキームがこの問題の根底にあると仮定します。この論文では、確率的に量子化された変分オートエンコーダ（SQ-VAE）と呼ばれる、新しい確率的量子化と量子化を介して標準VAEを拡張する新しいトレーニングスキームを提案します。 SQ-VAEでは、量子化はトレーニングの初期段階では確率的であるが、自己アニーリングと呼ばれる決定論的量子化に向かって徐
arxiv_reader 2022/05/17
ベクトル量子化変分オートエンコーダー（VQ-VAE）の注目すべき問題の1つは、学習された離散表現がコードブックの全容量のごく一部しか使用しないことです。これはコードブックの崩壊としても知られています。

arXiv

representation

arXiv reaDer

quantization
リンク
ディープイメージとジェネレーティブプライアを使用した圧縮ピコグラフィー
arxiv_reader 2022/05/17
Ptychographyは、ナノメートルスケールでのサンプルの非侵襲的イメージングを可能にする、確立されたコヒーレント回折イメージング技術です。防衛産業や材料科学など、さまざまな分野で幅広く利用されて

reconstruction

arXiv

generative

dataset

arXiv reaDer
リンク
効率的な超解像のための残留ローカル機能ネットワーク
arxiv_reader 2022/05/17
ディープラーニングベースのアプローチは、単一画像の超解像（SISR）で優れたパフォーマンスを実現しました。ただし、効率的な超解像の最近の進歩は、パラメーターとFLOPの数を減らすことに焦点を当てており

arXiv

super-resolution

pre-training

learning

residual

contrastive

convolutional

arXiv reaDer
リンク
表面平滑化とイメージングへの応用を伴うガウス曲率正則化モデルのための演算子分割法
arxiv_reader 2022/05/17
ガウス曲率は表面の重要な幾何学的特性であり、数学的モデリングで広く使用されています。ガウス曲率は完全に非線形であるため、それに基づくモデルの効率的な数値解法は文献では一般的ではありません。この記事では

regularization

arXiv

denoising

arXiv reaDer
リンク
CLIPasso：意味認識オブジェクトスケッチ
arxiv_reader 2022/05/17
線画はシンプルで最小限の性質を持っているため、抽象化はスケッチの中心です。抽象化では、オブジェクトまたはシーンの本質的な視覚的特性を特定する必要があります。これには、意味の理解と高レベルの概念に関する

arXiv

differentiable

arXiv reaDer

dataset
リンク
雑然とした屋内環境でのトポロジー的に永続的な機能ベースのオブジェクト認識
arxiv_reader 2022/05/17
目に見えない屋内環境での閉塞物の認識は、移動ロボットにとって難しい問題です。この作業は、この課題に対処するために、オブジェクトの点群の3D形状をキャプチャする新しいスライスベースのトポロジ記述子を提案

arXiv

robot

dataset

3D

benchmark

classification

arXiv reaDer

point cloud
リンク
ダウンストリームタスクのパフォーマンスを予測するマニホールド特性
arxiv_reader 2022/05/17
事前トレーニング方法は、通常、線形分類器の精度を評価するか、学習パフォーマンスを転送するか、表現多様体（RM）の低次元投影を視覚的に検査することによって比較されます。 RMを直接調査することで、方法間

adversarial

arXiv

manifold

metric

gradient

transfer learning

representation

self-supervised

tracking

arXiv reaDer
リンク
画像エラー隠蔽のための残差フィルタリングによる周波数選択的外挿
arxiv_reader 2022/05/17
信号外挿の目的は、既知のサンプルから未知の信号部分を推定することです。このタスクは、画像およびビデオ通信でのエラー隠蔽にとって特に重要です。高品質の再構成を取得するには、この決定されていない問題を解決

reconstruction

video

arXiv

domain

residual

arXiv reaDer
リンク
頭脳の構築：大血管閉塞検出におけるデータ拡張のためのサブボリューム再結合
arxiv_reader 2022/05/17
虚血性脳卒中は、多くの場合、大血管閉塞（LVO）によって引き起こされます。これは、コンピューター断層撮影血管造影スキャンで視覚化および診断できます。時間は脳であるため、これらのスキャンの高速で正確な自

arXiv

augmentation

occlusion

human

arXiv reaDer

classification

detection
リンク
CT金属アーチファクト低減のための適応畳み込み辞書ネットワーク
arxiv_reader 2022/05/17
ディープニューラルネットワークの大成功に触発されて、学習ベースの方法は、コンピューター断層撮影（CT）画像の金属アーチファクト低減（MAR）の有望なパフォーマンスを獲得しています。ただし、既存のアプロ

arXiv

dataset

CT

synthesis

embedding

representation

convolutional

arXiv reaDer
リンク
拡散ベースの画像修復のためのスパースマスクの学習
拡散ベースの修復は、スパースデータから画像を再構築するための強力なツールです。その品質は、既知のデータの選択に大きく依存します。それらの空間的位置（修復マスク）を最適化することは困難です。このタスクで一般的に使用されるツールは、確率的最適化戦略です。ただし、複数の修復結果を計算するため、速度は遅くなります。学習したマスク生成モデルの観点から救済策を提供します。マスク生成とニューラルサロゲート修復用の2つのネットワークを使用して完全な修復パイプラインをエミュレートすることにより、高効率の適応マスク生成のモデルを取得します。実験によると、私たちのモデルは4桁もの加速で競争力のある品質を達成できます。私たちの調査結果は、高速エンコーディングが非常に望ましい画像圧縮などのアプリケーションにとって、拡散ベースの修復をより魅力的にするための基礎として役立ちます。 Diffusion-based inp
arxiv_reader 2022/05/17
拡散ベースの修復は、スパースデータから画像を再構築するための強力なツールです。その品質は、既知のデータの選択に大きく依存します。それらの空間的位置（修復マスク）を最適化することは困難です。このタスクで

reconstruction

arXiv

learning

compression

sparse

arXiv reaDer
リンク
PASS：個人の再識別のための部分認識自己監視事前トレーニング
arxiv_reader 2022/05/17
人物再識別（ReID）では、ごく最近の研究で、ラベルのない人物画像でのモデルの事前トレーニングがImageNetよりもはるかに優れていることが検証されています。ただし、これらの研究では、画像分類用に設

arXiv

pre-training

learning

person

self-supervised

re-id

arXiv reaDer

classification
リンク
動的機能集約によるロバストな表現
arxiv_reader 2022/05/17
ディープ畳み込みニューラルネットワーク（CNN）ベースのモデルは、敵対的な攻撃に対して脆弱です。考えられる理由の1つは、CNNベースのモデルの埋め込みスペースがまばらであり、敵対的なサンプルを生成する

adversarial

arXiv

sparse

dataset

OOD

embedding

regularization

CNN

arXiv reaDer

detection
リンク
敵対的浄化のための拡散モデル
arxiv_reader 2022/05/17
敵対的浄化とは、生成モデルを使用して敵対的摂動を除去する防御方法のクラスを指します。これらの方法は、攻撃の形式や分類モデルを想定していないため、既存の分類子を目に見えない脅威から守ることができます。し

adversarial

arXiv

generative

dataset

arXiv reaDer

classification
リンク
ReDFeat：マルチモーダル特徴学習のための再結合検出と記述
arxiv_reader 2022/05/17
検出と記述を組み合わせた深層学習ベースの局所特徴抽出アルゴリズムは、可視画像のマッチングにおいて大きな進歩を遂げました。ただし、このようなフレームワークのエンドツーエンドのトレーニングは、検出の強力な

arXiv

pre-training

benchmark

learning

synthesis

arXiv reaDer

detection
リンク
分類による二値化: ソフト関数は本当に必要ですか?
arxiv_reader 2022/05/17
バイナリニューラルネットワークは、符号関数を利用して実際の値を2値化し、その非微分特性は、バックプロパゲーション中に必然的に大きな勾配エラーをもたらします。勾配を近似するために多くの手作業で設計された

arXiv

keypoint

dataset

gradient

pose estimation

human pose estimation

arXiv reaDer

classification
リンク
マルチビュー線画に関する自己監視空間推論
arxiv_reader 2022/05/17
最先端の監視されたディープネットワークによるマルチビュー線画の空間的推論は、最近、SPARE3Dデータセットの不可解な低パフォーマンスで示されています。多数のデータが利用可能な場合に自己監視学習が役立

arXiv

dataset

3D

reasoning

learning

representation

pose

self-supervised

arXiv reaDer

classification
リンク
DSPoint：高周波融合によるデュアルスケール点群認識
arxiv_reader 2022/05/17
点群処理は、その希薄さと不規則性のために困難な作業です。以前の作品では、ローカル機能アグリゲーターまたはグローバル幾何学的アーキテクチャのいずれかに繊細なデザインが導入されていますが、両方の利点を組み

arXiv

attention

convolutional

arXiv reaDer

point cloud
リンク
3D 点群の変圧器: 調査
arxiv_reader 2022/05/17
近年、Transformerモデルは、長距離依存関係モデリングの優れた機能を備えていることが証明されています。彼らは自然言語処理（NLP）と画像処理の両方で満足のいく結果を達成しました。この重要な成果

arXiv

3D

learning

classification

transformer

segmentation

arXiv reaDer

point cloud

detection
リンク
アクティブな半教師あり学習によるセマンティックセグメンテーション
arxiv_reader 2022/05/17
ディープラーニングを使用して、非常に優れたセマンティックセグメンテーションシステムを作成できるようになりました。ただし、画像をトレーニングするための前提条件となるピクセル単位の注釈を収集することは、依

semi-supervised

arXiv

dataset

learning

semantic segmentation

human

arXiv reaDer
リンク
高速点群登録のための対応グラフの信頼性に基づく新しい外れ値除去戦略
arxiv_reader 2022/05/17
登録は、点群処理における基本的でありながら重要なタスクです。通信ベースの点群登録では、点群手法による対応の一致により、非常に高い外れ値の比率が生じる可能性があります。現在の方法は、依然として効率、精度

arXiv

dataset

estimation

arXiv reaDer

point cloud
リンク
PillarNet：リアルタイムで高性能のPillarベースの3Dオブジェクト検出
arxiv_reader 2022/05/17
自動運転では、リアルタイムで高性能な3Dオブジェクト検出が非常に重要です。最近の最高性能の3Dオブジェクト検出器は、主にポイントベースまたは3Dボクセルベースの畳み込みに依存しています。これらは両方と

autonomous driving

arXiv

dataset

3D

learning

real time

convolutional

CNN

arXiv reaDer

detection
リンク
SimVLM：弱い監視による単純な視覚言語モデルの事前トレーニング
arxiv_reader 2022/05/17
視覚的表現とテキスト表現の共同モデリングの最近の進歩により、ビジョン言語事前トレーニング（VLP）は、多くのマルチモーダルダウンストリームタスクで印象的なパフォーマンスを達成しました。ただし、クリーン

arXiv

zero-shot

generative

VQA

benchmark

representation

arXiv reaDer

captioning
リンク
SuperWarp：不変サブボクセルのU-Netでの教師あり学習とワープ-正確な登録
arxiv_reader 2022/05/17
近年、学習ベースの画像レジストレーション方法は、ターゲットワープによる直接監視から徐々に自己監視を使用するようになり、いくつかの登録ベンチマークで優れた結果が得られています。これらのアプローチは、変形

arXiv

estimation

benchmark

learning

self-supervised

loss function

U-Net

arXiv reaDer
リンク
ディープラーニングによる高解像度CMBレンズ再構成
arxiv_reader 2022/05/17
次世代の宇宙マイクロ波背景放射（CMB）調査は、視線に沿った質量の地図を作成することにより、原始宇宙に関する貴重な情報を提供することが期待されています。これらのレンズ収束マップを作成するための従来のツ

GAN

reconstruction

arXiv

learning

arXiv reaDer
リンク
動的オブジェクトを追跡するためのビジョンベースのガイダンス
arxiv_reader 2022/05/17
この論文では、ランデブーコーンアプローチに基づくガイダンス法則を使用して動的オブジェクトを追跡するための新しいビジョンベースのフレームワークを提示します。これらのガイダンス法により、単眼カメラを搭載し

arXiv

monocular

occlusion

arXiv reaDer

tracking

simulation

classification
リンク
ピクセルからの深層強化学習のためのVisionTransformerメソッドの評価
arxiv_reader 2022/05/17
ビジョントランスフォーマー（ViT）は最近、コンピュータービジョン用のトランスフォーマーアーキテクチャの重要な可能性を示しました。標準の畳み込みニューラルネットワーク（CNN）アーキテクチャと比較して

arXiv

computer vision

contrastive learning

self-supervised

reinforcement learning

transformer

CNN

arXiv reaDer
リンク
ベースラインMRIからの多発性硬化症における将来の病変活動と治療効果の個人化された予測
arxiv_reader 2022/05/17
多発性硬化症（MS）などの慢性疾患の精密医療では、個々の患者の有効性と副作用/好みのバランスが最も取れた治療法を選択する必要があります。効果的な治療法を見つけるのが遅れると、不可逆的な障害が発生する可

arXiv

dataset

MRI

activity

arXiv reaDer
リンク
逆問題の汎用ソリューションとしての生成フロー
arxiv_reader 2022/05/17
データ分布をモデル化するための生成フローの成功により、逆問題で調査されてきました。事前にトレーニングされた生成フローを考えると、以前の作業では、正則化項として潜在変数の2ノルムを最小化することが提案さ

arXiv

generative

denoising

pre-training

regularization

arXiv reaDer
リンク
CNNの最適な機能を介した食品検出のための新しいマルチカラムカーネルエクストリームラーニングマシン
arxiv_reader 2022/05/17
自動食品検出は、ソーシャルメディアプラットフォームでの食品画像の検出から、食事評価アプリでのユーザーからの非食品写真のフィルタリングに至るまで、幅広いアプリケーションで注目を集めています。最近、COV

arXiv

dataset

learning

activity

arXiv reaDer

CNN

COVID-19

detection
リンク
トラックはトランプを意味しない：画像分析におけるヒューマンエラーの診断
arxiv_reader 2022/05/17
アルゴリズムは、人間の偏見やエラーを検出して分析するための強力なツールを提供します。ここでは、人間が特定のハイステークスタスクである画像解釈でどのように誤りを犯すかを分析するための機械学習手法を開発し

arXiv

dataset

bias

interpretation

learning

human

arXiv reaDer
リンク
実世界の設定での分散検出のスケーリング
arxiv_reader 2022/05/17
分布外の例を検出することは、新しい生物学的現象や自動運転車の検出など、セーフティクリティカルな機械学習アプリケーションにとって重要です。ただし、既存の研究は主に単純な小規模設定に焦点を当てています。よ

arXiv

dataset

learning

benchmark

anomaly

OOD

segmentation

arXiv reaDer

detection
リンク
軌道予測におけるクロスデータセットのパフォーマンスの不確実性の推定
arxiv_reader 2022/05/17
軌道予測手法の開発には多くの作業が行われ、このタスクのベンチマークとしてさまざまなデータセットが提案されていますが、データセット全体でのこれらの手法の一般化と転送可能性については、これまでほとんど研究

arXiv

dataset

trajectory

estimation

arXiv reaDer
リンク
リモートセンシング事前訓練の実証的研究
arxiv_reader 2022/05/17
ディープラーニングは、航空写真を理解するためのリモートセンシング（RS）研究を大幅に再構築し、大きな成功を収めました。それにもかかわらず、既存のディープモデルのほとんどは、ImageNetの事前トレー

arXiv

computer vision

dataset

domain

semantic segmentation

representation

transformer

CNN

arXiv reaDer

detection
リンク
音楽カバー画像の条件付きベクトルグラフィックス生成
Conditional Vector Graphics Generation for Music Cover Images 敵対的生成ネットワーク（GAN）は、コンピューター画像合成の領域の急速な成長を動機付けています。ほとんどすべての既存の画像合成アルゴリズムは画像をピクセルマトリックスと見なすため、高解像度の画像合成は複雑です。適切な代替手段はベクトル画像です。ただし、それらは高度に洗練されたパラメトリック空間に属しており、GANによるベクトルグラフィックスの合成タスクを解決するための制限です。この論文では、この制限を劇的に緩和し、ベクター画像合成の使用を可能にする特定のアプリケーションドメインを検討します。音楽のカバー画像は、インターネットストリーミングサービスと印刷標準の要件を満たす必要があります。これは、そのような画像のコンテンツに追加の要件がなくても、グラフィック素材の高解像度
arxiv_reader 2022/05/17
敵対的生成ネットワーク（GAN）は、コンピューター画像合成の領域の急速な成長を動機付けています。ほとんどすべての既存の画像合成アルゴリズムは画像をピクセルマトリックスと見なすため、高解像度の画像合成は

GAN

arXiv

domain

synthesis

arXiv reaDer
リンク
顔面処理技術の規制：イリノイBIPAの適用における法的考慮事項と技術的考慮事項の間の緊張
arxiv_reader 2022/05/17
顔面処理技術（FPT）の開発と展開に起因する害は、ますます論争の的になっています。米国のいくつかの州や都市では、法執行機関や政府による顔認識の使用が禁止されていますが、FPTは依然として開発されており

reasoning

arXiv

face

arXiv reaDer
リンク
深い残余ネットワークのバッチ正規化におけるガンマの正則化のガイドライン
arxiv_reader 2022/05/17
ニューラルネットワークの重みのL2正則化は、標準的なトレーニングトリックとして広く使用されています。ただし、バッチ正規化のトレーニング可能なパラメーターであるガンマのL2正則化は、議論の余地のない謎の

batch normalization

arXiv

learning

residual

regularization

transformer

arXiv reaDer
リンク
マルチラベル画像分類のためのプライマルオブジェクトクエリを備えたビジュアルトランスフォーマー
arxiv_reader 2022/05/17
マルチラベル画像分類は、順序のないシーケンシャルデータと見なすことができるクラスラベルのセットを予測することです。トランスフォーマーはシーケンシャルデータ全体を処理するため、本質的にセット予測に優れて

arXiv

metric

dataset

attention

transformer

arXiv reaDer

classification

detection
リンク
FreeMatch：半教師あり学習のための自己適応しきい値処理
arxiv_reader 2022/05/17
信頼性ベースのしきい値処理を使用した疑似ラベリングおよび整合性正則化アプローチは、半教師あり学習（SSL）で大きな進歩を遂げました。この論文では、ラベルのないデータ分布と望ましい信頼度のしきい値との関

semi-supervised

arXiv

learning

regularization

arXiv reaDer
リンク
敵対的生成ネットワークと医療画像用の人工知能を使用したCOVID-19との闘い：スコーピングレビュー
arxiv_reader 2022/05/17
このレビューは、COVID-19データの不足と診断に関連する課題に対処する上でのGANの役割に関する包括的な研究を示しています。これは、COVID-19のさまざまなGANメソッドと肺画像データセットを

GAN

arXiv

augmentation

CT

super-resolution

CNN

segmentation

arXiv reaDer

COVID-19
リンク
Transformerを使用したビデオフレーム補間
arxiv_reader 2022/05/17
ビデオの中間フレームを合成することを目的としたビデオフレーム補間（VFI）は、過去数年にわたって深い畳み込みネットワークの開発で目覚ましい進歩を遂げました。畳み込みネットワークに基づいて構築された既存

video

arXiv

benchmark

attention

face

convolutional

transformer

arXiv reaDer
リンク
閉塞した顔の分類と人の再識別における融合ディープニューラルネットワークベースの伝達学習
arxiv_reader 2022/05/17
最近のパンデミックの時期には、マスクの使用回数が増えるにつれ、顔の画像が遮られていても人物の識別が非常に重要になっています。この論文は、顔画像における4つのタイプのうちの1つのオクルージョンを認識する

arXiv

transfer learning

face recognition

recurrent

landmark

real time

identification

re-id

arXiv reaDer

detection
リンク
ディープフェイク検出のための実中心の一貫性学習
arxiv_reader 2022/05/17
以前のディープフェイク検出研究のほとんどは、人間が知覚できる方法でアーティファクトを記述および識別するための努力を曲げました。これにより、クラス内のいくつかの重要な不変性機能を無視し、インターネット干

deepfake

arXiv

bias

representation learning

synthesis

contrastive

face

human

arXiv reaDer

detection
リンク
TridentAdapt：ソースとターゲットの対立と自己誘導型クロスドメイン拡張によるドメイン不変性の学習
arxiv_reader 2022/05/17
グラウンドトゥルースラベルを取得するのは難しいため、仮想世界のデータセットから学習することは、セマンティックセグメンテーションなどの実際のアプリケーションにとって非常に重要です。ドメイン適応の観点から

arXiv

augmentation

dataset

pre-training

benchmark

semantic segmentation

learning

representation

domain adaptation

arXiv reaDer
リンク
Nonconvex {L_1/2}-圧縮センシングベースのCT再構成のための正規化された非局所自己相似性デノイザー
arxiv_reader 2022/05/17
圧縮センシング（CS）ベースのコンピューター断層撮影（CT）画像再構成は、スパースビュー投影データを通じて放射線リスクを低減することを目的としています。通常、不完全な投影から満足のいく画質を達成するこ

reconstruction

arXiv

CT

approximation

sparse

arXiv reaDer
リンク
AV-HuBERTを使用したリップベースのオーディオビジュアルスピーカー埋め込みの学習
arxiv_reader 2022/05/17
この論文は、話者の口の領域を示す視覚的ストリームが入力として音声と一緒に使用される視聴覚話者表現学習のための自己監視事前訓練を調査します。私たちの研究は、最近開発された汎用の視聴覚音声事前トレーニング

arXiv

BERT

pre-training

embedding

self-supervised

arXiv reaDer

representation learning
リンク
深さからの顕著性の促進：深い教師なしRGB-D顕著性検出
arxiv_reader 2022/05/17
深度センサーの人気と深層学習技術の急速な進歩もあって、RGB-D顕著な物体検出（RGB-D SOD）への関心の高まりが近年目撃されています。残念ながら、既存のRGB-D SODメソッドでは、通常、ピク

saliency

unsupervised

arXiv

RGB-D

learning

representation

arXiv reaDer

detection
リンク
細胞振動モデルを使用した低照度画像の強調
arxiv_reader 2022/05/17
暗い場所では、画像の品質が低下し、視覚的なタスクが失敗する可能性があります。既存の画像強調技術は、過度の強調、色の歪み、または時間の消費を招きやすく、その適応性はかなり制限されています。そこで、新しい

arXiv

segmentation

arXiv reaDer
リンク
小さなデータを使用したパーソナライズされたビジュアルエンコーディングモデルの構築
arxiv_reader 2022/05/17
刺激に対する脳の反応パターンを予測するエンコーディングモデルは、ボトムアップ神経系の変動性と個人の行動または病的状態との間のこの関係を捉える1つの方法です。ただし、通常、最適な精度を実現するには、大量

arXiv

domain

synthesis

face

human

arXiv reaDer
リンク
教師あり学習と自己教師あり学習のためのプロキシレスニューラルアーキテクチャの適応
arxiv_reader 2022/05/17
最近、ニューラルアーキテクチャ検索（NAS）メソッドが導入され、多くのベンチマークで印象的なパフォーマンスを示しています。これらのNAS研究の中で、Neural Architecture Transf

arXiv

NAS

dataset

adaptation

learning

benchmark

self-supervised

transformer

arXiv reaDer
リンク
GLaMa：一般的な画像修復のための共同の空間損失と周波数損失
arxiv_reader 2022/05/17
画像修復の目的は、残りの部分からのコンテキスト情報を使用して、傷や損傷した領域を回復することです。近年、畳み込みニューラルネットワーク（CNN）の復活のおかげで、画像修復タスクは大きな進歩を遂げました

reconstruction

adversarial

arXiv

unsupervised

dataset

domain

CNN

arXiv reaDer
リンク
開集合認識のための不確かさ校正の評価
視覚的分類問題の予測精度で大きな成功を収めたにもかかわらず、ディープニューラルネットワーク（DNN）は、分布外（OOD）データに自信過剰の確率を提供することに苦しんでいます。それでも、安全で信頼性の高いロボットの自律性には、正確な不確実性の推定が不可欠です。この論文では、OODデータのキャリブレーション方法の従来の評価とは明らかに異なる方法で、開集合条件の一般的なキャリブレーション手法を評価します。私たちの結果は、閉集合DNNキャリブレーションアプローチは、開集合認識にはあまり効果的ではないことを示しています。これは、この問題に対処するための新しいDNNキャリブレーション方法を開発する必要性を浮き彫りにします。 Despite achieving enormous success in predictive accuracy for visual classification proble
arxiv_reader 2022/05/17
視覚的分類問題の予測精度で大きな成功を収めたにもかかわらず、ディープニューラルネットワーク（DNN）は、分布外（OOD）データに自信過剰の確率を提供することに苦しんでいます。それでも、安全で信頼性の高

arXiv

robot

estimation

DNN

OOD

arXiv reaDer

classification
リンク
レポートガイド付きの対照的なトレーニングによる固定セットの病理認識を破る
arxiv_reader 2022/05/17
画像を読むとき、放射線科医はその中の発見を説明するテキストレポートを生成します。現在の最先端のコンピュータ支援診断ツールは、トレーニングのためにこれらの医療レポートから自動的に抽出された事前定義された

arXiv

dataset

contrastive

arXiv reaDer

classification
リンク
ETAD: ラップトップでエンドツーエンドのトレーニングアクション検出
arxiv_reader 2022/05/17
時間的アクション検出（TAD）などのトリミングされていないビデオの理解は、コンピューティングリソースに対する膨大な需要の痛みに悩まされることがよくあります。ビデオの長さが長く、GPUメモリが限られてい

arXiv

gradient

arXiv reaDer

action

video

detection
リンク
クロスエッジモダリティに注意を払ったグラフニューラルネットワークを使用した3Dマルチオブジェクトトラッキング
arxiv_reader 2022/05/17
オンライン3Dマルチオブジェクトトラッキング（MOT）は、主に自律システムコミュニティからの需要に牽引されて、近年大きな研究関心を集めています。ただし、3DオフラインMOTは比較的検討されていません。

arXiv

GNN

trajectory

3D

domain

attention

LiDAR

convolutional

MOT

arXiv reaDer
リンク
ディープニューラルネットワークの効率的な層の微調整による天体の分類
Classification of Astronomical Bodies by Efficient Layer Fine-Tuning of Deep Neural Networks SDSS-IVデータセットには、天文台によってキャプチャされた銀河、星、クエーサーなどのさまざまな天体に関する情報が含まれています。 SDSS-IVデータセットを分類するために転移学習を利用したディープマルチモーダル学習の研究に触発され、分類シナリオでの効果を研究するために、これらのアーキテクチャの微調整に関する研究をさらに拡張しました。 Resnet-50、DenseNet-121 VGG-16、Xception、EfficientNetB2、MobileNetV2、Nas netMobileなどのアーキテクチャは、さまざまなレベルでレイヤーごとの微調整を使用して構築されています。私たちの調査結果は、Ima
arxiv_reader 2022/05/17
SDSS-IVデータセットには、天文台によってキャプチャされた銀河、星、クエーサーなどのさまざまな天体に関する情報が含まれています。 SDSS-IVデータセットを分類するために転移学習を利用したディー

arXiv

metric

dataset

transfer learning

arXiv reaDer

classification
リンク
顔のキーポイント検出の再検討：ディープニューラルネットワークを使用した効率的なアプローチ
arxiv_reader 2022/05/17
顔のランドマークの検出は、多くの分野で幅広い用途があるため、広く研究されているディープラーニングの分野です。これらの重要なポイントは、目の中心、目の内側と外側の角、口の中心、鼻の先端など、人間の感情や

arXiv

augmentation

transfer learning

emotion

landmark

face

human

CNN

arXiv reaDer

detection
リンク
欠陥のある鋳造製品を特定するための効率的な深層学習方法
arxiv_reader 2022/05/17
最近、大規模な製造業では品質検査が非常に重要になっています。ヒューマンエラーを減らすために、そのような欠陥のある製品を特定するために効率的で低計算のAIアルゴリズムを使用することが不可欠になっています

arXiv

augmentation

dataset

transfer learning

pre-training

identification

human

arXiv reaDer

classification

detection
リンク
ディープラーニングとロケーションプライアを使用した頸動脈内腔と血管壁のセグメンテーション
arxiv_reader 2022/05/17
このレポートでは、頸動脈血管壁セグメンテーションチャレンジの方法と結果を紹介します。手元のセグメンテーション問題を解決するために、U-Netアーキテクチャとロケーション事前分布を利用した画像ベースのパ

arXiv

learning

U-Net

segmentation

arXiv reaDer
リンク
FIgLib＆SmokeyNet：リアルタイムの荒野の火災煙探知のためのデータセットとディープラーニングモデル
arxiv_reader 2022/05/17
米国西部の荒野火災の規模と頻度は、近年劇的に増加しています。火災の危険性が高い日には、小さな火災の発火が急速に拡大し、制御不能になる可能性があります。最初の煙からの発火の早期発見は、管理が困難になる前

arXiv

dataset

learning

real time

human

arXiv reaDer

detection
リンク
微分可能なSARレンダラーとSARターゲットの再構築
arxiv_reader 2022/05/17
波の散乱とレーダーイメージングメカニズムのフォワードモデリングは、合成開口レーダー（SAR）画像からの情報抽出の鍵です。光学領域のインバースグラフィックスのように、本質的に統合されたフォワードインバー

reconstruction

arXiv

3D

domain

synthesis

differentiable

arXiv reaDer

simulation
リンク
PFGDF：ディープニューラルネットワークアクセラレーション用のガウス分布機能によるプルーニングフィルター
arxiv_reader 2022/05/17
畳み込みニューラルネットワークに多くの冗長な情報が存在すると、機器のエッジへの展開が遅くなります。この問題を解決するために、データ分布特性に基づく新しい深層学習モデルの圧縮加速方法、つまり、特定の層

pruning

arXiv

learning

compression

CNN

arXiv reaDer
リンク
マルチモーダルカーブの検出とフィルタリング
arxiv_reader 2022/05/17
自動運転車のナビゲーションには、道路境界に関する信頼できる知識が不可欠です。カメラセマンティクスと高密度LIDARポイントクラウドの融合に基づく堅牢なカーブ検出およびフィルタリング技術を提案します。

unsupervised

arXiv

clustering

LiDAR

vehicle

arXiv reaDer

point cloud

detection
リンク
ONCE-3DLanes：単眼3Dレーン検出の構築
arxiv_reader 2022/05/17
ONCE-3DLanesは、3D空間でレーンレイアウトアノテーションを使用した実際の自動運転データセットです。単眼画像からの従来の2D車線検出では、道路が不均一な場合のため、自動運転での計画および制御

autonomous driving

arXiv

metric

monocular

3D

benchmark

anchor free

arXiv reaDer

point cloud

detection
リンク
確率的人間軌道予測のための非確率サンプリングネットワーク
arxiv_reader 2022/05/17
マルチモーダルな性質をキャプチャすることは、確率的な歩行者の軌道予測に不可欠であり、将来の軌道の有限セットを推測します。推論された軌道は、観測パスと、推論ステップでの歩行者の潜在的な決定の潜在ベクトル

arXiv

pedestrian

trajectory

benchmark

human

arXiv reaDer
リンク
ソースフリービデオドメイン適応のための時間的一貫性の学習
arxiv_reader 2022/05/17
ビデオベースの教師なしドメイン適応（VUDA）メソッドは、ビデオモデルの堅牢性を向上させ、さまざまな環境にわたるアクション認識タスクに適用できるようにします。ただし、これらの方法では、適応プロセス中に

video

unsupervised

arXiv

learning

benchmark

domain adaptation

action recognition

arXiv reaDer
リンク
リアルタイム画像ジオローカリゼーションのためのクロススケール視覚表現の学習
arxiv_reader 2022/05/17
ロボットのローカリゼーションは、GPSが拒否された環境では依然として困難な作業です。カメラやIMUなどのローカルセンサーに基づく状態推定アプローチは、エラーが蓄積するにつれて、長距離ミッションでドリフ

arXiv

robot

localization

dataset

estimation

domain

learning

representation

real time

arXiv reaDer
リンク
3D 全身イメージングを使用した色素性皮膚病変のモニタリング
arxiv_reader 2022/05/17
画像分析の革新的な進歩を可能にする最新のデータ駆動型機械学習研究は、皮膚病変の文書化、マッピング、追跡方法を再定義するための重要なツールになりました。皮膚病変の迅速な評価とマッピングを可能にする3D全

reconstruction

arXiv

3D

learning

synthesis

attention

human

CNN

arXiv reaDer

detection
リンク
フーリエ敵対的ネットワークを介した動的照明条件でのロバストな知覚のための軽量HDRカメラISP
arxiv_reader 2022/05/17
市販のコンパクトカメラセンサーのダイナミックレンジが限られているため、照明条件が変化するシーンの表現が不正確になり、画質に悪影響を及ぼし、その後、基礎となる画像処理アルゴリズムのパフォーマンスが制限さ

adversarial

arXiv

domain

semantic segmentation

representation

CNN

arXiv reaDer

detection
リンク
ディープSNNでのMaxPooling操作のスパイク近似
arxiv_reader 2022/05/17
スパイキングニューラルネットワーク（SNN）は、低電力AIの可能性を示している、生物学的にインスピレーションを得たニューラルネットワークの新しいドメインです。ディープSNNを構築する方法は多数あり、人

arXiv

dataset

approximation

domain

SNN

CNN

arXiv reaDer
リンク
産業用物体の腐食検出：マルチセンサーシステムから5Dフィーチャスペースまで
arxiv_reader 2022/05/17
腐食は、工業用途で使用される金属製の物体の表面にしばしば現れる損傷の一種です。これらの損傷は、使用するオブジェクトの目的によっては重大な場合があります。光学ベースのテストシステムは、非接触データ取得の

arXiv

augmentation

3D

domain

arXiv reaDer

classification

detection
リンク
ローカリゼーション機能を備えたGAN生成の洪水画像を検出するためのアーキテクチャ
arxiv_reader 2022/05/17
このホワイトペーパーでは、新しい画像フォレンジックタスク、つまり、ClimateGANアーキテクチャによって生成された偽の洪水画像の検出について説明します。これを行うには、検出ブランチとローカリゼーシ

arXiv

localization

dataset

learning

identification

arXiv reaDer

detection
リンク
2グリッドサイクル補正と幾何学的事前蒸留による解釈可能なMRI再構成ネットワーク
arxiv_reader 2022/05/17
CSは、アンダーサンプリングされたk空間データからのMR画像の取得を高速化するための効率的な方法です。既存の深層学習CS-MRI法はかなり印象的なパフォーマンスを達成しましたが、そのほとんどはマルチサ

reconstruction

arXiv

learning

MRI

arXiv reaDer

distillation
リンク
RTMV：新しいビュー合成のためのレイトレーシングマルチビュー合成データセット
arxiv_reader 2022/05/17
高解像度（1600 x 1600ピクセル）で高品質のレイトレーシングを使用して、約2000の複雑なシーンからレンダリングされた約300kの画像で構成される、新しいビュー合成用の大規模な合成データセット

arXiv

dataset

3D

benchmark

synthesis

mesh

sparse

arXiv reaDer
リンク
セマンティックセグメンテーション用の変圧器スケールゲート
マルチスケールのコンテキスト情報を効果的にエンコードすることは、正確なセマンティックセグメンテーションにとって非常に重要です。既存の変圧器ベースのセグメンテーションモデルは、選択なしでスケール全体の機能を組み合わせます。最適ではないスケールの機能は、セグメンテーションの結果を低下させる可能性があります。ビジョントランスフォーマーの固有の特性を活用して、マルチスケール機能を最適に組み合わせるためのシンプルで効果的なモジュールであるトランスフォーマースケールゲート（TSG）を提案します。TSGは、スケール選択のためにビジョントランスフォーマーの自己の手がかりとクロスアテンションを活用します。 TSGは、柔軟性の高いプラグアンドプレイモジュールであり、エンコーダーデコーダーベースの階層型ビジョンTransf ormerアーキテクチャーに簡単に組み込むことができます。 PascalコンテキストとAD
arxiv_reader 2022/05/17
マルチスケールのコンテキスト情報を効果的にエンコードすることは、正確なセマンティックセグメンテーションにとって非常に重要です。既存の変圧器ベースのセグメンテーションモデルは、選択なしでスケール全体の機

arXiv

dataset

semantic segmentation

transformer

arXiv reaDer
リンク
オブジェクト検出器用のコーティングされた敵対的カモフラージュの学習
arxiv_reader 2022/05/17
敵対者は、敵対的なノイズを生成することにより、ディープニューラルネットワークオブジェクト検出器をだますことができます。既存の作品のほとんどは、敵対的な「パッチ」方式でローカルの可視ノイズを学習すること

adversarial

arXiv

computer vision

3D

learning

pose

arXiv reaDer

detection
リンク
AASeg：リアルタイムセマンティックセグメンテーションのための注意認識ネットワーク
arxiv_reader 2022/05/17
この論文では、リアルタイムのセマンティック画像セグメンテーションのためのAttention Aware Network（AASeg）という名前の新しいネットワークを紹介します。私たちのネットワークは、

arXiv

dataset

semantic segmentation

real time

attention

arXiv reaDer
リンク
ネットワークプルーニング用の重み依存ゲート
arxiv_reader 2022/05/17
この論文では、剪定指標、剪定率、および効率の制約の問題に同時に対処するために、単純でありながら効果的なネットワーク剪定フレームワークを提案します。この論文は、剪定の決定は畳み込みの重みに依存するべきで

pruning

arXiv

arXiv reaDer

convolutional
リンク
マルチプレーンコンピュータ生成ホログラフィのための現実的な焦点ぼけ
arxiv_reader 2022/05/17
この論文では、自然に見えるデフォーカスブラーを備えたアーチファクトのない高品質ホログラムを再構築するための新しいマルチプレーンCGH計算方法を紹介します。私たちの方法は、新しいターゲティングスキームと

arXiv

gradient

loss function

sparse

arXiv reaDer
リンク
オブジェクトを意識した自己監視型マルチラベル学習
arxiv_reader 2022/05/17
画像データのマルチラベル学習は、ディープラーニングモデルで広く活用されています。ただし、深いCNNモデルの教師ありトレーニングでは、分類に十分な識別機能を見つけることができないことがよくあります。その

arXiv

dataset

learning

representation

self-supervised

CNN

arXiv reaDer

classification
リンク
皮膚病変セグメンテーションのための自己監視支援能動学習
arxiv_reader 2022/05/17
ラベルの不足は、注釈のコストが高く、専門家の要件があるため、生物医学画像のセグメンテーションにとって長年の問題でした。最近、アクティブラーニング（AL）戦略は、データのごく一部に注釈を照会することで注

arXiv

learning

clustering

self-supervised

segmentation

arXiv reaDer
リンク
超解像ネットワークの一般化能力の評価
Evaluating the Generalization Ability of Super-Resolution Networks パフォーマンスと一般化能力は、深層学習モデルを評価するための2つの重要な側面です。ただし、超解像（SR）ネットワークの一般化能力に関する研究は現在ありません。 SRネットワーク、すなわちSRGAの一般化評価指標を提案する最初の試みを行います。 SRGAは、一般化能力を測定するために出力画像ではなく、ディープネットワークの内部機能の統計的特性を利用します。特に、それはノンパラメトリックで非学習のメトリックです。私たちの方法をよりよく検証するために、合成画像と実世界の画像の両方を含み、さまざまな劣化をカバーするパッチベースの画像評価セット（PIES）を収集します。 SRGAおよびPIESデータセットを使用して、一般化機能について既存のSRモデルのベンチマークを行
arxiv_reader 2022/05/17
パフォーマンスと一般化能力は、深層学習モデルを評価するための2つの重要な側面です。ただし、超解像（SR）ネットワークの一般化能力に関する研究は現在ありません。 SRネットワーク、すなわちSRGAの一般

arXiv

metric

dataset

super-resolution

learning

benchmark

synthesis

arXiv reaDer
リンク
シーングラフ生成のための重要性加重構造学習
arxiv_reader 2022/05/17
シーングラフの生成は、入力画像の視覚的に接地されたシーングラフを作成することにより、オブジェクトとその関係を明示的にモデル化することを目的とした構造化された予測タスクです。現在、メッセージパッシングニ

arXiv

approximation

learning

benchmark

arXiv reaDer

Bayesian
リンク
SaiNet：生成ネットワークを使用したオブジェクトの背後にあるステレオ対応の修復
arxiv_reader 2022/05/17
この作業では、オブジェクトの背後にある大きな欠落領域を修復することを目的として、ステレオ整合性のある画像修復のためのエンドツーエンドのネットワークを提示します。提案されたモデルは、部分畳み込みを使用し

arXiv

generative

stereo

occlusion

convolutional

arXiv reaDer
リンク
Panoptic-PHNet：クラスタリング疑似ヒートマップを介したリアルタイムで高精度のLiDARPanopticセグメンテーションに向けて
Panoptic-PHNet：クラスタリング疑似ヒートマップを介したリアルタイムで高精度のLiDARPanopticセグメンテーションに向けて Panoptic-PHNet: Towards Real-Time and High-Precision LiDAR Panoptic Segmentation via Clustering Pseudo Heatmap 新たな課題として、パノラマセグメンテーションはセマンティックセグメンテーションとインスタンスセグメンテーションの両方で課題に直面しています。ただし、速度と精度の観点から、この分野の既存のLiDARメソッドはまだ制限されています。この論文では、Panoptic-PHNetと呼ばれる高速で高性能なLiDARベースのフレームワークを提案します。3つの魅力的な側面があります。1）新しいパラダイムとしてクラスタリング疑似ヒートマップを導入し
arxiv_reader 2022/05/17
新たな課題として、パノラマセグメンテーションはセマンティックセグメンテーションとインスタンスセグメンテーションの両方で課題に直面しています。ただし、速度と精度の観点から、この分野の既存のLiDARメソ

arXiv

dataset

learning

semantic segmentation

panoptic segmentation

clustering

real time

LiDAR

arXiv reaDer
リンク
医療画像セグメンテーションのためのボクセルごとの敵対的半教師あり学習
arxiv_reader 2022/05/17
医療画像セグメンテーションの半教師あり学習は、医療分野での信頼性の高い大規模な注釈の構築に関連する莫大なコストを軽減するための重要な研究分野です。最近の半教師ありアプローチは、一貫性の正則化、疑似ラベ

semi-supervised

adversarial

arXiv

domain

embedding

regularization

segmentation

arXiv reaDer

representation learning
リンク
マルチヘッドニューラルネットワークを使用した視覚障害者の支援のための効率的なジェスチャ認識
arxiv_reader 2022/05/17
この論文は、視覚障害を持つ人々を助けることを目的とした手のジェスチャーによって制御されるモバイルデバイスのためのインタラクティブなシステムを提案します。このシステムにより、ユーザーは単純な静的および動

arXiv

localization

dataset

gesture

synthesis

action

arXiv reaDer

classification
リンク
RiCS：体積オブジェクトを調和させるための2D自己閉塞マップ
RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects ディープラーニングを使用したコンピュータービジョンでは、目覚ましい成功を収めています。このようなブレークスルーは堅牢なパフォーマンスを示していますが、オクルージョンや物理的相互作用の予測など、詳細な知識の学習には依然として多くの課題があります。最近のいくつかの研究は、そのようなコンテキストを提供する際の3Dデータの可能性を示していますが、2Dと3Dの間の次元の不整合のために、2Dモデルに3D入力を効率的に提供する方法は不明です。自己閉塞の予測で2Dモデルの成功を活用するために、カメラ空間でのレイマーチング（RiCS）を設計します。これは、前景オブジェクトの自己閉塞を3Dで2D自己閉塞マップに表現する新しい方法です。与えられた背景画像とコヒーレントなシェーディング
arxiv_reader 2022/05/17
ディープラーニングを使用したコンピュータービジョンでは、目覚ましい成功を収めています。このようなブレークスルーは堅牢なパフォーマンスを示していますが、オクルージョンや物理的相互作用の予測など、詳細な知

arXiv

computer vision

dataset

3D

synthesis

representation

human

segmentation

arXiv reaDer
リンク
BronchusNet：気管支のセグメンテーションと分類のための事前に埋め込まれた表現学習の領域と構造
arxiv_reader 2022/05/17
CTベースの気管支樹分析は、臨床医に構造化された情報を提供できるため、呼吸器疾患のコンピューター支援診断において重要な役割を果たします。気道分析の基礎は、気管支のセグメンテーションと分類からなる気管支

reconstruction

arXiv

CT

benchmark

segmentation

arXiv reaDer

classification

representation learning
リンク
画像ノイズ除去用の高密度残留トランス
arxiv_reader 2022/05/17
画像のノイズ除去は、ノイズの多い画像からノイズのない高品質の画像を再構築することを目的とした、重要な低レベルのコンピュータビジョンタスクです。ディープラーニングの開発に伴い、畳み込みニューラルネットワ

reconstruction

arXiv

computer vision

denoising

compression

synthesis

residual

transformer

CNN

arXiv reaDer
リンク
効率的なラストメーターの経路探索のための顕著性ガイド付きストリートビュー画像修復フレームワーク
A Saliency-Guided Street View Image Inpainting Framework for Efficient Last-Meters Wayfinding 全地球測位システム（GPS）は、さまざまなナビゲーションアプリケーションで重要な役割を果たしてきました。それにもかかわらず、最後の数メートル以内に完璧な目的地を特定することは重要ですが、未解決の問題のままです。 GPS測位精度によって制限され、ナビゲーションシステムは常に目的地の近くをユーザーに表示しますが、正確な位置は表示しません。没入型メディアテクノロジーとしての地図のストリートビュー画像（SVI）は、人間のラストメーターの経路探索に物理的な環境を提供するための補助として役立ちました。ただし、地理的コンテキストと取得条件が非常に多様であるため、キャプチャされたSVIには常にさまざまな注意散漫なオブジェ
arxiv_reader 2022/05/17
全地球測位システム（GPS）は、さまざまなナビゲーションアプリケーションで重要な役割を果たしてきました。それにもかかわらず、最後の数メートル以内に完璧な目的地を特定することは重要ですが、未解決の問題の

saliency

vehicle

arXiv

pedestrian

attention

convolutional

human

arXiv reaDer

detection
リンク
ImageSig：超軽量画像認識のための署名変換
ImageSig: A signature transf orm for ultra-lightweight image recognition この論文は、画像認識のための新しい軽量の方法を紹介した。 ImageSigは署名の計算に基づいており、畳み込み構造や注意ベースのエンコーダーを必要としません。 a）64 X 64 RGB画像の精度が、最先端の方法の多くを超え、同時にb）必要なFLOPS、電力、およびメモリフットプリントが桁違いに少ないことは、著者にとって驚くべきことです。事前にトレーニングされたモデルのサイズは、44.2KBまで小さくすることができます。 ImageSigは、RaspberryPiやJetson-nanoなどのハードウェアで前例のないパフォーマンスを示しています。 ImageSigは、画像を複数のチャネルを持つストリームとして扱います。これらのストリームは、空間方向
arxiv_reader 2022/05/17
この論文は、画像認識のための新しい軽量の方法を紹介した。 ImageSigは署名の計算に基づいており、畳み込み構造や注意ベースのエンコーダーを必要としません。 a）64 X 64 RGB画像の精度が、

arXiv

arXiv reaDer

convolutional
リンク
劣化適応を伴う3DMRI超解像のための教師なし表現学習
Unsupervised Representation Learning for 3D MRI Super Resolution with Degradation Adaptation 高解像度（HR）MRIは、医師の診断と画像誘導治療を支援する上で重要ですが、取得時間が長いため、臨床現場では取得が困難です。そのため、研究コミュニティは、取得時間を短縮してHR MRI画像を再構成するために、深層学習ベースの超解像（SR）技術を調査しました。ただし、このようなニューラルネットワークのトレーニングには、通常、HRと低解像度（LR）の生体内画像のペアが必要です。これらの画像は、画像取得中および取得間の患者の動きのために取得が困難です。硬組織の硬い動きは画像レジストレーションで修正できますが、変形した軟組織の位置合わせは困難であり、このような本物のHRおよびLR画像ペアを使用してニューラルネットワ
arxiv_reader 2022/05/17
高解像度（HR）MRIは、医師の診断と画像誘導治療を支援する上で重要ですが、取得時間が長いため、臨床現場では取得が困難です。そのため、研究コミュニティは、取得時間を短縮してHR MRI画像を再構成する

reconstruction

unsupervised

arXiv

adaptation

super-resolution

3D

synthesis

MRI

arXiv reaDer

representation learning
リンク
AVCAffe：認知的負荷とリモートワークへの影響に関する大規模な視聴覚データセット
arxiv_reader 2022/05/17
認知的負荷と感情属性で構成される最初の視聴覚データセットであるAVCAffeを紹介します。ビデオ会議プラットフォームを介してリモートワークシナリオをシミュレートすることにより、AVCAffeを記録しま

arXiv

dataset

learning

benchmark

arXiv reaDer

video
リンク
CoSSL：不均衡な半教師あり学習のための表現と分類器の共同学習
arxiv_reader 2022/05/17
本論文では、不均衡なSSLのための分離表現学習と分類器学習を備えた新しい共同学習フレームワーク（CoSSL）を提案します。データの不均衡を処理するために、分類器学習用のテールクラス機能拡張（TFE）を

semi-supervised

arXiv

dataset

benchmark

arXiv reaDer

representation learning
リンク
顔認識タスクを改善するための拡張顔画像の使用
Using Augmented Face Images to Improve Facial Recognition Tasks 機械学習モデルのトレーニングのために、GANで拡張された画像を使用して、通常は過小評価されている特定の属性を補完するフレームワークを紹介します。これにより、顔認識タスクのこれらの属性よりも推論品質を向上させることができます。 We present a framework that uses GAN-augmented images to complement certain specific attributes, usually underrepresented, for machine learning model training. This allows us to improve inference quality over those attribut
arxiv_reader 2022/05/17
機械学習モデルのトレーニングのために、GANで拡張された画像を使用して、通常は過小評価されている特定の属性を補完するフレームワークを紹介します。これにより、顔認識タスクのこれらの属性よりも推論品質を向

arXiv

augmentation

learning

face

arXiv reaDer
リンク
画像から確率論的解剖学的形状へ：深い変分ボトルネックアプローチ
From Images to Probabilistic Anatomical Shapes: A Deep Variational Bottleneck Approach 3D医療画像から直接統計的形状モデリング（SSM）は、病理を検出し、病気を診断し、人口レベルの形態分析を行うための十分に活用されていないツールです。ディープラーニングフレームワークは、従来のSSMワークフローで専門家主導の手動および計算のオーバーヘッドを削減することにより、医療現場でSSMを採用する可能性を高めました。ただし、ニューラルネットワークは、機密性の高い臨床的意思決定では信頼できない自信過剰な予測を生成する可能性があるため、このようなフレームワークを臨床診療に変換するには、不確実性の調整が必要です。気晴らし（データ依存）の不確実性を伴う形状を予測するための既存の手法は、モデルトレーニングから分離して計算された
arxiv_reader 2022/05/17
3D医療画像から直接統計的形状モデリング（SSM）は、病理を検出し、病気を診断し、人口レベルの形態分析を行うための十分に活用されていないツールです。ディープラーニングフレームワークは、従来のSSMワー

arXiv

3D

learning

representation

arXiv reaDer
リンク
cMinMax：N次元凸ポリトープの角を見つけるための高速アルゴリズム
arxiv_reader 2022/05/17
ここ数年、拡張現実と仮想現実（AR-VR）の新たな分野は驚異的な成長を遂げました。同時に、計算能力が求められる低コストで高品質のARシステムを開発する傾向があります。特徴点は、これらのリアルタイムフレ

arXiv

augmentation

robot

SLAM

3D

real time

tracking

arXiv reaDer

detection
リンク
クリップされた双曲線分類子は超双曲線分類子です
arxiv_reader 2022/05/17
双曲空間は、ユークリッド空間とは異なり、自然に階層を埋め込むことができます。双曲ニューラルネットワーク（HNN）は、分類のために双曲空間にユークリッドの特徴を持ち上げることによってそのような表現力を活

adversarial

arXiv

dataset

benchmark

OOD

arXiv reaDer

classification

detection
リンク
モバイルデバイスでのイベントベースのコンピュータビジョンのフレームワーク
A Framework for Event-based Computer Vision on a Mobile Device イベントカメラから携帯電話に直接データをストリーミングする最初の公開されたAndroidフレームワークを紹介します。今日のモバイルデバイスは、これまでになく幅広いワークロードを処理し、デバイスをよりスマートで、よりユーザーフレンドリーで、安全にするセンサーの範囲が拡大しています。特に従来のカメラはそのようなタスクで中心的な役割を果たしますが、記録される冗長な情報の量は処理にコストがかかるため、継続的に記録することはできません。一方、バイオインスパイアードイベントカメラは、視覚シーンの変化のみを記録し、顔検出、ジェスチャ認識、視線追跡などのモバイルタスクに特に適した有望な低電力アプリケーションを示しています。私たちのプロトタイプデバイスは、このようなイベントカメラをバ
arxiv_reader 2022/05/17
イベントカメラから携帯電話に直接データをストリーミングする最初の公開されたAndroidフレームワークを紹介します。今日のモバイルデバイスは、これまでになく幅広いワークロードを処理し、デバイスをよりス

reconstruction

arXiv

computer vision

optical flow

pre-training

real time

embedding

tracking

arXiv reaDer

detection
リンク
暗黙の再投影ネットワークによる単眼の人間のデジタル化
arxiv_reader 2022/05/17
画像から3D人間モデルを生成するためのアプローチを提示します。私たちのフレームワークの鍵は、片面の正投影深度マップとカラー画像を単一の透視投影画像から予測することです。私たちのフレームワークは3つのネ

arXiv

metric

monocular

3D

attention

face

human

arXiv reaDer
リンク
ELODI：ポジティブ合同トレーニングのためのアンサンブルロジット差抑制
arxiv_reader 2022/05/17
ネガティブフリップは、レガシーモデルが新しいモデルに置き換えられたときに分類システムに導入されるエラーです。負のフリップ率（NFR）を減らす既存の方法は、モデル蒸留を使用して全体的な精度を犠牲にして行

distillation

arXiv

arXiv reaDer

classification
リンク
「独立したパーツを個別に教える」（TIPSy-GAN）：教師なし敵対2Dから3Dポーズ推定における精度と安定性の改善
arxiv_reader 2022/05/17
TIPSy-GANを紹介します。これは、教師なしの敵対的2Dから3Dへの人間の姿勢推定の精度と安定性を向上させるための新しいアプローチです。私たちの仕事では、人間の運動学的骨格を1つの空間的に共依存す

adversarial

arXiv

unsupervised

dataset

weakly-supervised

3D

pose estimation

knowledge distillation

human pose estimation

arXiv reaDer
リンク
継続的なディープフェイク検出ベンチマーク: データセット、メソッド、および要点
arxiv_reader 2022/05/17
ディープフェイクを検出するためのベンチマークと手法が数多く登場しています。ただし、実際のシナリオで段階的に出現するディープフェイクの検出を研究している作品はほとんどありません。ワイルドシーンをシミュレ

arXiv

detection

benchmark

learning

arXiv reaDer

generative

deepfake

dataset
リンク
多元的な画像修復のためのトランスフォーマーでの情報損失を減らす
arxiv_reader 2022/05/17
トランスフォーマーは、最近、多元的な画像修復で大きな成功を収めています。ただし、既存のトランスベースのソリューションは各ピクセルをトークンと見なすため、2つの側面から情報損失の問題が発生します。1）効

arXiv

dataset

quantization

arXiv reaDer

transformer

CNN
リンク
HierAttn：皮膚病変診断のためのステージ注意とブランチ注意から表現を効果的に学ぶ
arxiv_reader 2022/05/17
皮膚病変の正確で偏りのない検査は、皮膚の状態や障害の早期診断と治療に不可欠です。皮膚病変の視覚的特徴は、異なるタイプの画像装置を使用して異なる皮膚色の患者から皮膚画像が収集されるため、大幅に異なります

classification

representation

arXiv

learning

attention

arXiv reaDer

dataset

CNN
リンク
画像超解像トランスでより多くのピクセルを有効化
arxiv_reader 2022/05/17
トランスフォーマーベースの方法は、画像の超解像などの低レベルの視覚タスクで優れたパフォーマンスを示しています。ただし、これらのネットワークは、アトリビューション分析を通じて、限られた空間範囲の入力情報

arXiv

reconstruction

pre-training

attention

super-resolution

arXiv reaDer

transformer
リンク
- 2022年5月18日
- 2022年5月17日
- 2022年5月16日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx