arxiv_readerのブックマーク / 2022年5月19日 - はてなブックマーク

arxiv_reader id:arxiv_reader

2022年5月19日のブックマーク (69件)

時空間学習者としてのマスクされたオートエンコーダ
arxiv_reader 2022/05/19
この論文は、ビデオから学習する時空間表現へのマスクされたオートエンコーダ（MAE）の概念的に単純な拡張を研究します。ビデオの時空パッチをランダムにマスクし、オートエンコーダーを学習してピクセル単位で再

pre-training

dataset

transformer

BERT

arXiv

bias

domain

representation learning

embedding

arXiv reaDer
リンク
MonoTrack：単眼バドミントンビデオからのシャトル軌道の再構築
arxiv_reader 2022/05/19
弾道には、各ポイントの勝ち負けだけでなく、勝ち負けの方法に関する情報も含まれているため、弾道推定はラケットスポーツ分析の基本的なコンポーネントです。バドミントンなどのスポーツでは、シャトルコックやボー

tracking

trajectory

segmentation

arXiv

reconstruction

monocular

3D

arXiv reaDer

pose
リンク
BodyMap：全身の高密度コレスポンデンスマップの学習
arxiv_reader 2022/05/19
人間間の密な対応は、野生の表面のマッチング、追跡、再構築など、全身を理解するための基本的な問題を解決するために利用できる強力な意味情報を運びます。この論文では、BodyMapを紹介します。これは、衣服

tracking

dataset

transformer

arXiv

reconstruction

learning

3D

synthesis

arXiv reaDer

metric
リンク
病変サイズの再重み付けを使用した高性能病変検出およびセグメンテーションのための操作点の最適化
arxiv_reader 2022/05/19
患者の画像内のすべての限局性病変（病変、腫瘍など）の正確な検出とセグメンテーションを必要とする多くの臨床状況があります。小さな病変と大きな病変が混在している場合、標準的なバイナリクロスエントロピー損失

dataset

detection

segmentation

arXiv

arXiv reaDer
リンク
病変セグメンテーションのための集約データセットにおけるコホートバイアス適応
arxiv_reader 2022/05/19
限局性病理学（病変、腫瘍など）の検出とセグメンテーションのために開発された多くの自動機械学習モデルはうまく機能しますが、新しい患者コホートにも一般化されておらず、実際の臨床状況への広範な採用を妨げてい

dataset

detection

segmentation

arXiv

bias

MRI

pooling

adaptation

arXiv reaDer
リンク
DIVeR：ボリュームレンダリングのための決定論的統合を備えたリアルタイムで正確な神経放射輝度フィールド
arxiv_reader 2022/05/19
DIVeRは、NeRFとそのバリアント（密度モデルとボリュームレンダリング）の主要なアイデアに基づいて構築され、少数の画像からリアルにレンダリングできる3Dオブジェクトモデルを学習します。以前のすべて

real time

arXiv

representation

3D

arXiv reaDer
リンク
確率論的な専門家の混合による複数の画像の完成
arxiv_reader 2022/05/19
複数の画像補完は、画像補完のために視覚的にリアルで多様な結果を生成することに焦点を当てています。以前の方法は、このタスクの経験的な成功を享受しています。ただし、多元的な画像の完成に使用される制約は、2

arXiv reaDer

arXiv
リンク
VRAG：コンテンツベースのビデオ検索のためのリージョンアテンショングラフ
arxiv_reader 2022/05/19
コンテンツベースのビデオ取得（CBVR）は、ビデオの推奨やフィルタリングなどのアプリケーションのメディア共有プラットフォームで使用されます。数十億のビデオに拡張するデータベースを管理するには、効率が高

video

convolutional

attention

arXiv

spatio-temporal

embedding

arXiv reaDer
リンク
https://arxiv-check-250201.firebaseapp.com/each/2205.09048v3
arxiv_reader 2022/05/19
デジタル全スライドスキャン技術に基づいて、深層学習に代表される人工知能アルゴリズムは、計算病理学の分野で驚くべき結果を達成しました。コンピュータ断層撮影（CT）や磁気共鳴画像法（MRI）などの他の医用

dataset

CT

classification

arXiv

representation

MRI

transfer learning

arXiv reaDer

self-supervised
リンク
堅牢な画像認識のためのバイオインスパイアードモデルの経験的アドボカシー
arxiv_reader 2022/05/19
ディープ畳み込みニューラルネットワーク（DCNN）は、コンピュータービジョンに革命をもたらし、人間の視覚システムの優れたモデルとして提唱されることがよくあります。ただし、現在DCNNには多くの欠点があ

adversarial

CNN

augmentation

computer vision

arXiv

benchmark

arXiv reaDer

human
リンク
MegLoc：堅牢で正確なビジュアルローカリゼーションパイプライン
arxiv_reader 2022/05/19
このホワイトペーパーでは、屋内と屋外のシーン、1日のさまざまな時間、1年のさまざまな季節、さらには何年にもわたるさまざまなシナリオで、堅牢で正確な6-DoFポーズ推定を行うためのビジュアルローカリゼー

dataset

localization

arXiv

autonomous driving

pose estimation

arXiv reaDer
リンク
分布クランプ前処理による機械学習モデルの攻撃スペースの制約
arxiv_reader 2022/05/19
前処理と外れ値の検出技術の両方がニューラルネットワークに適用され、さまざまな成功の度合いで堅牢性が向上しています。この論文では、理想的なプリプロセッサ機能を、任意の入力を受け取り、それを最も近い分布内

learning

arXiv reaDer

arXiv

detection
リンク
座標ネットワークにおける位置の複雑さと深さの取引
arxiv_reader 2022/05/19
座標ベースのMLPは、フーリエ特徴の配列として座標位置をエンコードすることにより、高周波情報を保持するという点でメリットがあることはよく知られています。これまで、これらの位置エンコーディングの有効性の

embedding

arXiv reaDer

arXiv
リンク
PocketNet：医療画像分析のためのより小さなニューラルネットワーク
arxiv_reader 2022/05/19
医用画像の深層学習モデルは、多くの場合、大きく複雑であり、これらのモデルをトレーニングおよび評価するための専用ハードウェアが必要です。このような問題に対処するために、畳み込みニューラルネットワークのチ

CNN

classification

segmentation

arXiv

learning

arXiv reaDer
リンク
光学リモートセンシング画像における顕著な物体検出のための軽量マルチスケールコンテキストネットワーク
arxiv_reader 2022/05/19
光学リモートセンシング画像（RSI）のより劇的なマルチスケールの変化とより複雑な前景と背景のために、光学RSIの顕著な物体検出（SOD）は大きな課題になります。ただし、自然シーン画像（NSI）とは異な

detection

saliency

arXiv

learning

benchmark

arXiv reaDer
リンク
UQGAN：条件付きGANを介してトレーニングされたディープ分類器の不確実性定量化のための統一モデル
arxiv_reader 2022/05/19
生成的敵対的ネットワーク（GAN）に基づいて、画像分類における深いニューラルネットワークの偶然性と認識論的不確実性の両方を定量化するためのアプローチを提示します。 GANを使用して分布外（OoD）の例

GAN

detection

OOD

classification

arXiv

arXiv reaDer
リンク
ヘッブ学習を使用した希少データを使用したCBIRの詳細機能
arxiv_reader 2022/05/19
ディープニューラルネットワーク（DNN）から抽出された機能は、コンテンツベースの画像検索（CBIR）のコンテキストで非常に効果的であることが証明されています。最近の研究では、生物学的に着想を得たヘッブ

pre-training

DNN

dataset

gradient

unsupervised

SGD

arXiv

learning

semi-supervised

arXiv reaDer
リンク
COVID-Net UV：超音波ビデオからのCOVID-19感染の自動診断のためのエンドツーエンドの時空間深側ニューラルネットワークアーキテクチャ
arxiv_reader 2022/05/19
予防接種に加えて、COVID-19のさらなる蔓延を緩和する効果的な方法として、公衆衛生の安全を確保するために、病気をテストするための個人の迅速かつ正確なスクリーニングがまだ必要です。凸型トランスデュー

detection

video

RNN

CNN

arXiv

COVID-19

spatio-temporal

arXiv reaDer
リンク
生成的敵対的ネットワークと拡張された異時点間リターンプロットによる財務時系列データ拡張
arxiv_reader 2022/05/19
データ拡張は、コンピュータービジョンで高度にパラメーター化されたモデルの予測と分類のパフォーマンスをサポートするための重要な正則化手法です。ただし、時系列ドメインでは、これらの方法が小さいサンプルサイ

GAN

augmentation

classification

computer vision

arXiv

regularization

domain

representation

arXiv reaDer

metric
リンク
暗黙のマルチプレーン表現によるリモートセンシングの新しいビュー合成
arxiv_reader 2022/05/19
リモートセンシングシーンの新しいビュー合成は、シーンの視覚化、人間とコンピューターの相互作用、およびさまざまなダウンストリームアプリケーションにとって非常に重要です。コンピュータグラフィックスと写真測

dataset

arXiv

reconstruction

representation

differentiable

3D

synthesis

arXiv reaDer

self-supervised
リンク
一度だけカット：シングルカットでデータ拡張を強化
arxiv_reader 2022/05/19
データ拡張を実行するためのYouOnly Cut Once（YOCO）を紹介します。 YOCOは、1つの画像を2つの部分に分割し、各部分内で個別にデータ拡張を実行します。 YOCOを適用すると、サンプ

pre-training

contrastive

augmentation

classification

arXiv

representation

arXiv reaDer
リンク
PET合成のための3Dセグメンテーションガイド付きスタイルベースの敵対的生成ネットワーク
arxiv_reader 2022/05/19
全線量陽電子放出断層撮影（PET）イメージングにおける潜在的な放射性ハザードは依然として懸念事項ですが、低線量画像の品質は臨床使用には決して望ましくありません。したがって、低線量のPET画像を全線量に

GAN

segmentation

arXiv

reconstruction

learning

3D

synthesis

arXiv reaDer
リンク
弱く監視された組織病理学的画像セグメンテーションのためのトランスフォーマーベースの複数インスタンス学習
arxiv_reader 2022/05/19
組織病理学的画像セグメンテーションアルゴリズムは、コンピューター支援診断技術において重要な役割を果たします。弱く監視されたセグメンテーションアルゴリズムの開発は、それが時間と労力を要するという医用画像

weakly-supervised

dataset

transformer

segmentation

arXiv

learning

arXiv reaDer
リンク
コピー検出パターンのモバイル認証
arxiv_reader 2022/05/19
近年、モノのインターネットやブランド保護アプリケーションで大きな関心を集めている物理世界とデジタル世界をつなぐリンクとして、コピー検出パターン（CDP）が注目されています。ただし、許可されていない当事

detection

classification

attention

arXiv

learning

arXiv reaDer
リンク
マンハッタン世界を想定したニューラル3Dシーンの再構築
arxiv_reader 2022/05/19
このホワイトペーパーでは、マルチビュー画像から3D屋内シーンを再構築するという課題に取り組んでいます。これまでの多くの作品は、テクスチャオブジェクトで印象的な再構成結果を示していますが、屋内シーンで一

dataset

semantic segmentation

arXiv

reconstruction

3D

estimation

arXiv reaDer
リンク
状態推定のための選択的センサーフュージョンの学習
arxiv_reader 2022/05/19
自動運転車と移動ロボットシステムには、通常、冗長性を提供するために複数のセンサーが装備されています。さまざまなセンサーからの観測を統合することにより、これらのモバイルエージェントは環境を認識し、システ

localization

arXiv reaDer

pose

point cloud

LiDAR

trajectory

odometry

monocular

estimation

arXiv
リンク
位置情報はあなたが必要とするすべてです：ビデオからの自己監視SVDEのための新しいパイプライン
arxiv_reader 2022/05/19
最近、完全に自己監視された方法で単眼ビデオからシーンの基礎となる3D構造を学習することに多くの注目が集まっています。このタスクの最も困難な側面の1つは、リジッドシーンの仮定を破るときに独立して移動する

quantization

video

attention

arXiv

learning

monocular

3D

estimation

arXiv reaDer

self-supervised
リンク
生成的ネットワークにおける物理情報に基づくガイド付き解きほぐし
arxiv_reader 2022/05/19
画像から画像への変換（i2i）ネットワークは、ターゲットドメイン内の物理関連の現象（オクルージョン、フォグなど）の存在下でエンタングルメント効果に悩まされ、変換品質、可制御性、および変動性を完全に低下

generative

disentangling

arXiv

learning

domain

occlusion

arXiv reaDer
リンク
医療ディープラーニング-体系的なメタレビュー
arxiv_reader 2022/05/19
ディープラーニング（DL）は、過去数年間にいくつかの異なる科学分野に大きな影響を与えてきました。たとえば、画像処理と分析では、DLアルゴリズムは他の最先端の方法よりも優れたパフォーマンスを発揮すること

arXiv

learning

domain

autonomous driving

arXiv reaDer
リンク
非常に少ないデータで明示的な正則化を行わずにゼロから学習する大規模なニューラルネットワーク
arxiv_reader 2022/05/19
最近の調査結果は、ニューラルネットワークがトレーニングエラーがゼロの過剰パラメータ化されたレジームでも一般化することを示しています。これは、従来の機械学習の知恵に完全に反しているため、驚くべきことです

dataset

CNN

augmentation

classification

arXiv

regularization

learning

domain

benchmark

arXiv reaDer
リンク
クリーンなデータなしのスペックル画像の復元
arxiv_reader 2022/05/19
スペックルノイズは、デジタルホログラフィー、合成開口レーダー、光コヒーレンストモグラフィー、超音波システムなどのコヒーレントイメージングシステムに固有の障害です。これらのシステムは通常、同じ関心オブジ

dataset

arXiv reaDer

arXiv

synthesis
リンク
ニューラルネットワークの敵対的ロバスト性を改善するための増加マージン敵対的 (IMA) トレーニング
arxiv_reader 2022/05/19
ディープニューラルネットワーク（DNN）は、敵対的なノイズに対して脆弱です。敵対的ノイズをトレーニングサンプルに追加することにより、敵対的トレーニングは、敵対的ノイズに対するモデルの堅牢性を向上させる

DNN

dataset

adversarial

segmentation

arXiv

estimation

arXiv reaDer
リンク
AdaAfford：数ショットの相互作用を介して3D関節オブジェクトに操作アフォーダンスを適応させる方法を学ぶ
arxiv_reader 2022/05/19
キャビネット、ドア、蛇口などの3D関節オブジェクトを認識して操作することは、人間の環境で日常のタスクを実行する将来のホームアシスタントロボットに特別な課題をもたらします。関節部分と関節パラメータを解析

dataset

arXiv

few-shot

learning

3D

arXiv reaDer

human

pose

robot
リンク
時空間畳み込みLSTMによる予測誤差を使用した異常検出
arxiv_reader 2022/05/19
この論文では、時空間畳み込み長短期記憶（convLSTM）を使用して、シーケンス間の予測と再構築のための既存のアーキテクチャによって動機付けられたビデオ異常検出の新しい方法を提案します。異常検出に関す

dataset

anomaly detection

convolutional

arXiv

reconstruction

spatio-temporal

seq2seq

benchmark

arXiv reaDer

LSTM
リンク
PhoCaL：測光的に挑戦的なオブジェクトを使用したカテゴリレベルのオブジェクトポーズ推定のためのマルチモーダルデータセット
arxiv_reader 2022/05/19
オブジェクトのポーズ推定は、ロボットアプリケーションと拡張現実にとって非常に重要です。インスタンスレベルの6Dオブジェクトポーズ推定方法を超えて、カテゴリレベルのポーズと形状を推定することは有望な傾向

RGB-D

dataset

augmentation

arXiv

monocular

6D

3D

benchmark

pose estimation

arXiv reaDer
リンク
検索のためのオブジェクト認識ビデオ言語事前トレーニング
最近、大規模なデータセットと強力なトランスフォーマーネットワークを導入することにより、ビデオ言語の事前トレーニングは、特に検索で大きな成功を収めています。それでも、既存のビデオ言語トランスフォーマーモデルは、明示的にきめ細かいセマンティックアラインメントを行いません。この作業では、オブジェクト認識トランスフォーマーを紹介します。これは、ビデオ言語トランスフォーマーを拡張してオブジェクト表現を組み込むオブジェクト中心のアプローチです。重要なアイデアは、バウンディングボックスとオブジェクトタグを活用してトレーニングプロセスをガイドすることです。広く使用されている4つのベンチマークで、ビデオテキストマッチングの3つの標準サブタスクでモデルを評価します。また、提案された方法に関する詳細な分析と詳細なアブレーションを提供します。検討したすべてのタスクとデータセットでパフォーマンスが明らかに向上してい
arxiv_reader 2022/05/19
最近、大規模なデータセットと強力なトランスフォーマーネットワークを導入することにより、ビデオ言語の事前トレーニングは、特に検索で大きな成功を収めています。それでも、既存のビデオ言語トランスフォーマーモ

pre-training

dataset

transformer

arXiv

representation

benchmark

arXiv reaDer
リンク
メタ学習とトランスフォーマーベースの関係モデリングによる被験者間アクションユニットの検出
arxiv_reader 2022/05/19
フェイシャルアクションユニット（AU）の検出は、顔の動きからの感情分析にとって重要なタスクです。異なる主題の明らかな違いは、AUによってもたらされる変更を誤解させることがあり、不正確な結果をもたらしま

dataset

detection

transformer

arXiv

emotion

face

representation learning

embedding

arXiv reaDer

action
リンク
自動運転における幾何学的事前分布を使用した視覚的注意に基づく自己監視絶対深度推定
arxiv_reader 2022/05/19
既存の単眼深度推定方法は大きな進歩を遂げましたが、ネットワークのモデリング能力が限られていることとスケールのあいまいさの問題により、単一の画像から正確な絶対深度マップを予測することは依然として困難です

dataset

attention

arXiv

monocular

autonomous driving

estimation

arXiv reaDer

self-supervised
リンク
適度に教師あり学習：定義、フレームワーク、および一般性
arxiv_reader 2022/05/19
監督下での学習は、多くの人工知能（AI）アプリケーションで目覚ましい成功を収めています。現在の文献では、トレーニングデータセット用に作成されたラベルのプロパティを参照することにより、教師あり学習は教師

learning

weakly-supervised

arXiv reaDer

arXiv
リンク
CTSARS-CoV-2セグメンテーションモデルを使用したCovid3Dローカリゼーションの転送可能性の評価
arxiv_reader 2022/05/19
最近の研究によると、CTスキャンでX線写真のパターンを検出すると、Covid-19のローカリゼーションに高い感度と特異性がもたらされる可能性があります。この論文では、CT画像の肺炎感染領域のセマンティ

pre-training

detection

localization

semantic segmentation

arXiv

COVID-19

3D

U-Net

transfer learning

arXiv reaDer
リンク
古代の弦楽器の客観的研究のための写真測量アプローチの検証
arxiv_reader 2022/05/19
いくつかの古代のバイオリンは、その歴史を通して減少してきました。縮小された機器と縮小されていない機器を区別するための客観的な写真測量アプローチを提案します。このアプローチでは、2Dスライスを調べること

mesh

arXiv reaDer

arXiv
リンク
3Dステガナリシスのレンズによる3D敵対点群に対する受動的防御
arxiv_reader 2022/05/19
今日、3Dデータはコンピュータビジョンの分野で消えない役割を果たしています。ただし、広範な研究により、点群などの3Dデータが供給されるディープニューラルネットワーク（DNN）は、DNNを誤った方向に導

DNN

detection

adversarial

computer vision

arXiv

3D

point cloud

arXiv reaDer
リンク
高速でノイズに強い単一ピクセルイメージングのための深く学習された直交基底パターン
arxiv_reader 2022/05/19
シングルピクセルイメージング（SPI）は、従来のカメラの概念を超えた斬新で型破りな方法ですが、リアルタイムアプリケーションでは計算コストが高く、時間がかかる可能性があります。 SPI再構成問題を解決す

compression

real time

convolutional

arXiv

reconstruction

learning

arXiv reaDer
リンク
FQ-ViT：完全に量子化されたビジョントランスフォーマーのトレーニング後の量子化
arxiv_reader 2022/05/19
ネットワーク量子化は、モデル推論の複雑さを大幅に軽減し、実際の展開で広く使用されています。ただし、ほとんどの既存の量子化手法は、主に畳み込みニューラルネットワーク（CNN）で開発されており、完全に量子

R-CNN

quantization

transformer

CNN

attention

arXiv

benchmark

arXiv reaDer
リンク
TTAPS：自己監視を使用してプロトタイプを整列させることによるテスト時間の適応
arxiv_reader 2022/05/19
今日、ディープニューラルネットワークは多くのタスクで人間よりも優れています。ただし、入力分布がトレーニングで使用されたものからずれると、パフォーマンスが大幅に低下します。最近公開された調査によると、モ

dataset

arXiv

representation

benchmark

arXiv reaDer

self-supervised
リンク
弱教師ありポリープフレーム検出のための対照的なトランスフォーマーベースのマルチインスタンス学習
arxiv_reader 2022/05/19
結腸内視鏡ビデオからの現在のポリープ検出方法は、通常の（すなわち、健康な）トレーニング画像のみを使用します。これは、i）連続するビデオフレームの時間情報の重要性を無視し、ii）ポリープに関する知識が不

weakly-supervised

dataset

video

anomaly detection

contrastive

convolutional

arXiv

learning

arXiv reaDer
リンク
ピクセル単位の残留収縮ネットワークを使用したロバストな光子効率の高いイメージング
arxiv_reader 2022/05/19
単一光子光検出および測距（LiDAR）は、困難なシナリオでの3Dイメージングに広く適用されています。ただし、収集されたデータの限られた信号光子数と高いノイズは、深度画像を正確に予測するための大きな課題

dataset

detection

classification

arXiv

residual

LiDAR

3D

estimation

arXiv reaDer
リンク
https://arxiv-check-250201.firebaseapp.com/each/2205.08728v2
arxiv_reader 2022/05/19
データ拡張は、ニューラルネットワークの一般化能力を向上させ、過剰適合を防ぐために使用できる非常に実用的な手法です。最近、混合サンプルデータの拡張が大きな注目を集め、大きな成功を収めています。混合サンプ

dataset

saliency

augmentation

attention

arXiv

arXiv reaDer
リンク
Dite-HRNet：人間のポーズ推定のための動的軽量高解像度ネットワーク
arxiv_reader 2022/05/19
高解像度ネットワークは、人間の姿勢推定のためにマルチスケールの特徴を抽出する優れた機能を示しますが、関節間の長距離の相互作用をキャプチャできず、計算が非常に複雑になります。これらの問題に対処するために

human pose estimation

dataset

convolutional

arXiv

pose estimation

arXiv reaDer
リンク
正規化された混合モデルによるエンドツーエンドのマルチオブジェクト検出
arxiv_reader 2022/05/19
最近のエンドツーエンドのマルチオブジェクト検出器は、非最大抑制（NMS）を使用した重複バウンディングボックスの削除など、手作りのプロセスを削除することにより、推論パイプラインを簡素化します。ただし、ト

detection

arXiv

regularization

benchmark

estimation

arXiv reaDer

sparse
リンク
それはSh！tpostingではありません、それは私のCAT投稿です
arxiv_reader 2022/05/19
この論文では、与えられた入力画像に対して陽気なキャプションを生成できる新しいアーキテクチャについて説明します。アーキテクチャは2つに分割されます。つまり、画像のキャプションと陽気なテキスト変換です。ア

pre-training

transformer

CNN

attention

arXiv

captioning

seq2seq

arXiv reaDer

LSTM
リンク
SemiCurv：半教師あり曲線構造セグメンテーション
arxiv_reader 2022/05/19
曲線構造のセグメンテーションに関する最近の研究は、主にバックボーンネットワークの設計と損失エンジニアリングに焦点を当てています。ラベル付けされたデータを収集するという課題は、費用と労力を要するプロセス

dataset

augmentation

segmentation

arXiv

learning

differentiable

semi-supervised

arXiv reaDer
リンク
ニューラルネットワークプルーニングによるハイパーパラメータの最適化
arxiv_reader 2022/05/19
深層学習モデルはハイパーパラメーターに大きく依存しているため、長時間かかる場合でも、深層学習モデルベースのアプリケーションを開発するにはハイパーパラメーターの最適化が不可欠です。深層学習モデルを使用し

dataset

Bayesian

arXiv

pruning

learning

arXiv reaDer
リンク
社会的距離の違反を特定するためのコンピュータビジョンと時間グラフを使用した公共のシーンの全体的な解釈
arxiv_reader 2022/05/19
COVID-19のパンデミックは、前例のない世界的な公衆衛生危機を引き起こしました。その固有の性質を考慮して、このパンデミックの拡大を抑制するための主要な戦略として、社会的距離の測定が提案されています

identification

interpretation

computer vision

arXiv

COVID-19

arXiv reaDer

human
リンク
レールプロファイルマッチングに関するディープラーニング
arxiv_reader 2022/05/19
現場で測定されたレール断面プロファイルを設計されたプロファイルと一致させることは、レールの摩耗を評価するために必須です。これは、線路の保守とレールの安全性にとって非常に重要です。これまでのところ、マッ

pre-training

dataset

CNN

arXiv

learning

arXiv reaDer

human
リンク
K-textures、衛星画像セグメンテーションのための自己監視型ハードクラスタリング深層学習アルゴリズム
arxiv_reader 2022/05/19
k-meansアルゴリズムなど、固定数のハードラベルで画像をセグメント化でき、深層学習手法のみに依存する深層学習の自己監視アルゴリズムは、まだ不足しています。ここでは、ak個のクラスに対して4バンド画

simulation

gradient

clustering

CNN

segmentation

arXiv

learning

satellite

arXiv reaDer
リンク
ステレオ知識の選択的蒸留による単眼深度推定の学習
arxiv_reader 2022/05/19
単眼深度推定は、深層学習に基づいて広く調査されてきましたが、その精度と一般化能力は、ステレオベースの方法よりもはるかに遅れています。これに取り組むために、いくつかの最近の研究は、プロキシグラウンドトゥ

dataset

arXiv

learning

stereo

arXiv reaDer

distillation

semi-supervised

estimation

monocular
リンク
意味的に正確な超解像敵対的ネットワーク
arxiv_reader 2022/05/19
この作業は、Generative Adversarial Network（GAN）のトレーニングで両方のパフォーマンスを共同で検討することにより、セマンティックセグメンテーションと画像の超解像の問題に

GAN

dataset

semantic segmentation

computer vision

arXiv

arXiv reaDer

super-resolution
リンク
堅牢な低照度画像の強調に向けて
arxiv_reader 2022/05/19
この論文では、野生で見つかった暗い画像から明るい画像を作成する問題を研究します。薄暗い環境で撮影されているため、画像は暗くなります。それらは、量子化とセンサーノイズによって引き起こされるカラーシフトに

dataset

quantization

simulation

arXiv

reconstruction

learning

arXiv reaDer
リンク
RARITYNet：Rarity Guided Affective Emotion Learning Framework
arxiv_reader 2022/05/19
手作りの深層学習アプローチの資産から着想を得て、RARITYNet：RARITYガイド付き感情感情学習フレームワークを提案し、外観の特徴を学習し、顔の表情の感情クラスを特定しました。 RARITYNe

emotion

arXiv

learning

face

arXiv reaDer

pose
リンク
LatentKeypointGAN：潜在キーポイントを介した画像の制御-拡張要約
arxiv_reader 2022/05/19
敵対的生成ネットワーク（GAN）は、写真のようにリアルな画像を生成できるようになりました。ただし、画像コンテンツを最適に制御する方法は、未解決の課題です。 LatentKeypointGANを紹介しま

GAN

disentangling

human

arXiv

domain

self-supervised

embedding

arXiv reaDer

keypoint

pose
リンク
医用画像におけるデータの不均一性に取り組むためのラベル効率の高い自己監視連合学習
arxiv_reader 2022/05/19
ディープラーニングモデルのトレーニングに必要な複数の機関からの大規模な医療データセットのキュレーションは、プライバシー保護と患者データを共有することの難しさによって課題があります。さまざまな教育機関間

pre-training

dataset

OOD

transformer

classification

arXiv

learning

semi-supervised

arXiv reaDer

self-supervised
リンク
ロボットのローカリゼーションのための野生のテキスト検出と認識
arxiv_reader 2022/05/19
標識はいたるところにあり、ロボットは標識を利用して、ローカライズ（視覚的場所認識（VPR）を含む）と地図作成を支援できる必要があります。ポーズ、不規則なテキスト、照明、オクルージョンなどの要因により、

dataset

detection

localization

arXiv

benchmark

occlusion

arXiv reaDer

pose

robot
リンク
GRI：一般的な強化模倣とその視覚ベースの自動運転への応用
arxiv_reader 2022/05/19
深層強化学習（DRL）は、自動運転やロボット工学など、いくつかの複雑な意思決定アプリケーションに効果的であることが実証されています。ただし、DRLは、サンプルの複雑さが高く、安定性がないために制限され

arXiv reaDer

reinforcement learning

arXiv

autonomous driving
リンク
CV4Code：ビジュアルコード表現によるソースコードの理解
arxiv_reader 2022/05/19
ソースコードを理解するためのコンパクトで効果的なコンピュータビジョン手法であるCV4Codeを紹介します。私たちの方法は、各スニペットを2次元画像として扱うことにより、コードスニペットから利用可能なコ

transformer

convolutional

computer vision

arXiv

learning

representation

embedding

arXiv reaDer
リンク
高密度予測用のビジョントランスアダプター
arxiv_reader 2022/05/19
この作業では、Vision Transformer（ViT）用のシンプルで強力なアダプターを調査します。視覚固有の誘導バイアスをアーキテクチャに導入する最近のビジュアルトランスとは異なり、ViTは、画

transformer

arXiv reaDer

semantic segmentation

bias

detection

arXiv

pre-training
リンク
視覚的な質問応答データセットにおける性別と人種のバイアス
arxiv_reader 2022/05/19
機械学習モデルで人間のような推論を評価する手段として、視覚と言語のタスクがますます注目を集めています。この分野で人気のあるタスクは、画像に関する質問に答えることを目的とした視覚的な質問応答（VQA）で

learning

arXiv reaDer

dataset

bias

attention

arXiv

reasoning

VQA
リンク
単一のハイパーネットワークで複数の画像再構成を計算する
arxiv_reader 2022/05/19
ディープラーニングベースの手法は、圧縮センシングなどの幅広い画像再構成タスクで最先端の結果を実現します。これらのメソッドには、ほとんどの場合、最適化された損失関数のさまざまな項のバランスをとる重み係数

learning

MRI

reconstruction

arXiv reaDer

dataset

super-resolution

arXiv

denoising

loss function
リンク
ディープラーニングを使用した同一の画像検索
arxiv_reader 2022/05/19
近年、画像との相互作用が増加していることがわかっています。画像の類似性には、特定の参照画像を順守する類似した画像をフェッチすることが含まれます。目標は、クエリとして検索された画像が同様の画像になるかど

learning

arXiv reaDer

dataset

convolutional

arXiv

pre-training

benchmark
リンク
- 2022年5月20日
- 2022年5月19日
- 2022年5月18日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx