arxiv_readerのブックマーク / 2022年1月5日 - はてなブックマーク

arxiv_reader id:arxiv_reader

2022年1月5日のブックマーク (72件)

教師なし再識別学習とオクルージョン推定によるオンラインマルチオブジェクト追跡
arxiv_reader 2022/01/05
異なるオブジェクト間のオクルージョンは、マルチオブジェクトトラッキング（MOT）の一般的な課題であり、検出されたオブジェクトが欠落しているため、トラッキング結果が低下することがよくあります。マルチオブ

arXiv

learning

MOT

occlusion

arXiv reaDer

detection

estimation

re-id

unsupervised
リンク
3Dガイダンスによるクロスドメインおよび解きほぐされた顔の操作
arxiv_reader 2022/01/05
3次元ガイダンスによる顔画像操作は、意味的に意味のある理解とユーザーフレンドリーな制御性により、さまざまなインタラクティブシナリオで広く適用されています。ただし、既存の3Dモーフィアブルモデルベースの

arXiv

human

pre-training

face

embedding

arXiv reaDer

disentangling

3D

domain adaptation
リンク
3DVSR：角度および空間ライトフィールド画像の超解像のための3DEPIボリュームベースのアプローチ
arxiv_reader 2022/01/05
シーンの空間情報と角度情報の両方をキャプチャするライトフィールド（LF）イメージングは、多くのアプリケーションにとって間違いなく有益です。 LF取得にはさまざまな手法が提案されていますが、角度的および

arXiv

arXiv reaDer

super-resolution

synthesis

3D

dataset
リンク
変化検出のための変圧器ベースのシャムネットワーク
arxiv_reader 2022/01/05
このホワイトペーパーでは、同時登録されたリモートセンシング画像のペアからの変化検出（CD）用のトランスベースのシャムネットワークアーキテクチャ（ChangeFormerと略記）を紹介します。完全畳み込

arXiv

convolutional

arXiv reaDer

detection

transformer

dataset
リンク
1億の医用画像からの自己監視学習
arxiv_reader 2022/01/05
医療画像評価のための正確で堅牢な人工知能システムを構築するには、高度な深層学習モデルの研究と設計だけでなく、注釈付きのトレーニング例の大規模で精選されたセットの作成も必要です。ただし、このようなデータ

arXiv

clustering

self-supervised

CT

arXiv reaDer

detection

contrastive learning

interpretation

dataset
リンク
一般的な腐敗に対する敵対的訓練の有効性について
arxiv_reader 2022/01/05
一般的な腐敗に対する堅牢性に関する文献は、敵対的な訓練がこの状況でのパフォーマンスを改善できるかどうかについてのコンセンサスを示していません。まず、適切に選択された摂動半径で使用すると、ℓ_pの敵対的

arXiv

arXiv reaDer

metric

augmentation

adversarial
リンク
Swin UNETR：MRI画像における脳腫瘍のセマンティックセグメンテーションのためのSwinトランスフォーマー
arxiv_reader 2022/01/05
脳腫瘍のセマンティックセグメンテーションは、臨床医が患者を診断し、悪性実体の進行を連続的に研究するのに役立つ複数のMRIイメージングモダリティを含む基本的な医用画像分析タスクです。近年、完全畳み込みニ

arXiv

semantic segmentation

MRI

computer vision

embedding

arXiv reaDer

transformer

CNN

3D

benchmark
リンク
網膜血管疾患検出のための転移学習：糖尿病性網膜症と未熟児網膜症を用いたパイロット研究
arxiv_reader 2022/01/05
網膜血管疾患は人体の健康に影響を及ぼし、時には検出されない身体的損傷のバイタルサインを提供します。最近、深層学習技術が糖尿病性網膜症（DR）の検出にうまく適用されています。他のほとんどの網膜血管疾患を

arXiv

transfer learning

human

arXiv reaDer

detection

metric
リンク
Neural Actor: ポーズ制御による人間のアクタの神経フリービュー合成
arxiv_reader 2022/01/05
Neural Actor (NA) は、任意の視点から、任意の制御可能な姿勢で人間を高品質に合成するための新しい方法です。私たちの方法は、2D 画像のみからジオメトリと外観の表現を学習する最近のニュー

arXiv

residual

representation

human

pose

video

arXiv reaDer

synthesis

3D

reconstruction
リンク
クラスター構造機能
arxiv_reader 2022/01/05
与えられた数の部分へのデータセットの各パーティションには、すべての部分がその部分のデータの可能な限り良いモデル（「アルゴリズムの十分統計量」）になるようなパーティションがあります。これは、1からデータ

arXiv

arXiv reaDer

clustering

segmentation
リンク
DeepFGS：学習した画像圧縮のためのきめ細かいスケーラブルコーディング
arxiv_reader 2022/01/05
チャネル帯域幅の変動に適応できるスケーラブルなコーディングは、今日の複雑なネットワーク環境でうまく機能します。ただし、既存のスケーラブルな圧縮方法には、圧縮パフォーマンスの低下とスケーラビリティの不足

arXiv

compression

face

arXiv reaDer

metric
リンク
スケルトンベースの歩行情報を使用したうつ病検出のためのデータ拡張
arxiv_reader 2022/01/05
近年、うつ病の発生率は世界中で急速に上昇していますが、大規模なうつ病のスクリーニングは依然として困難です。歩行分析は、うつ病の非接触、低コスト、および効率的な早期スクリーニング方法を提供します。ただし

arXiv

emotion

classification

human

arXiv reaDer

detection

augmentation

dataset
リンク
ディープメトリック学習による視覚的微化石の識別
arxiv_reader 2022/01/05
顕微鏡画像上でプランクティック有孔虫の殻を分類する問題に、初めてディープメトリック学習を適用します。この種認識タスクは、過去の気候を再構築するための重要な情報源であり、科学の柱です。文献にあるすべての

arXiv

metric learning

clustering

identification

human

domain

arXiv reaDer

CNN

benchmark
リンク
最小限の変更で譲渡可能な無制限の敵対的例に向けて
arxiv_reader 2022/01/05
転送ベースの敵対的な例は、ブラックボックス攻撃の最も重要なクラスの1つです。ただし、敵対的摂動の伝達可能性と知覚不能性の間にはトレードオフがあります。この方向での以前の作業では、良好な転送成功率に到達

learning

arXiv

arXiv reaDer

adversarial
リンク
敵対的にロバストなディープニューラルネットワークのアーキテクチャ要素の調査
arxiv_reader 2022/01/05
ディープニューラルネットワーク（DNN）は、敵対的な攻撃に対して脆弱であることが知られています。敵対的に頑強なDNNを訓練するために、さまざまな防御方法が提案されており、その中で敵対的な訓練は有望な結

arXiv

arXiv reaDer

DNN

adversarial
リンク
閉塞者の再識別のための短距離相関トランス
arxiv_reader 2022/01/05
閉塞した人物の再識別は、非効率的な特徴表現や低い認識精度などの問題に直面する、コンピュータービジョンの困難な領域の1つです。畳み込みニューラルネットワークは局所的な特徴の抽出に注意を払うため、閉塞した

arXiv

computer vision

dataset

attention

arXiv reaDer

pedestrian

transformer

CNN

re-id

reconstruction
リンク
複数人のポーズ回帰のための品質を意識した表現の学習
arxiv_reader 2022/01/05
既成の単一ステージの複数人のポーズ回帰法は、一般に、インスタンススコア（つまり、インスタンスのローカリゼーションの信頼性）を利用して、ポーズ候補を選択するためのポーズ品質を示します。既存のパラダイムに

arXiv

learning

representation

keypoint

pose

arXiv reaDer

person

localization
リンク
低GPUメモリ要件でSpatialConfiguration-Netを使用した効率的な多臓器セグメンテーション
arxiv_reader 2022/01/05
多くの医療データセットで適切に実行できる多くのセマンティックセグメンテーション方法が存在しますが、多くの場合、それらは臨床診療で直接使用するように設計されていません。 2つの主な懸念事項は、異なるスキ

arXiv

arXiv reaDer

semantic segmentation

dataset
リンク
3Dマップ上で建物の外観画像を識別し、ディープラーニングとデジタル画像処理を使用して標高情報を抽出します
arxiv_reader 2022/01/05
韓国の建築行政情報は、古くから質の高い情報を提供してきましたが、行政情報に重点を置いているため、有用性は高くありません。その一方で、技術の進歩とともに、より高解像度の3次元（3D）マップが登場しました

arXiv

learning

convolutional

3D

arXiv reaDer

detection

R-CNN
リンク
敵対的検出における画像変換の効果の理解と活用に向けて
arxiv_reader 2022/01/05
ディープニューラルネットワーク（DNN）は、敵対的な例からの脅威にさらされています。敵対的検出は、敵対的画像と良性画像を区別する堅牢なDNNベースのサービスの基本的な作業です。画像変換は、敵対的な例を

arXiv

DNN

arXiv reaDer

detection

adversarial
リンク
数ショット学習のためのテンソル機能幻覚
arxiv_reader 2022/01/05
数ショットの学習は、限られた監督だけでなく限られたデータも与えられた新しいタスクに対処する方法を学ぶという課題に対処します。魅力的なソリューションは、合成データの生成です。ただし、そのような方法のほと

arXiv

learning

few-shot

classification

GAN

arXiv reaDer

synthesis

loss function

augmentation

dataset
リンク
教師なしオープンワールドセマンティックセグメンテーションに向けて
arxiv_reader 2022/01/05
画像のセマンティックセグメンテーションの場合、最先端のディープニューラルネットワーク（DNN）は、そのタスクが閉じたクラスのセットに制限されている場合、高いセグメンテーション精度を実現します。ただし、

arXiv

semantic segmentation

learning

clustering

DNN

arXiv reaDer

unsupervised
リンク
普遍的な敵対的攻撃に関する調査
arxiv_reader 2022/01/05
敵対的な例の興味深い現象は、機械学習で大きな注目を集めています。コミュニティにとってもっと驚くべきことは、普遍的な敵対的な摂動（UAP）の存在です。つまり、ほとんどの画像のターゲットDNNをだますため

arXiv

learning

video

attention

domain

DNN

arXiv reaDer

adversarial
リンク
都市部における歩行者の快適さのための風の流れの評価のための位置符号化拡張GAN
arxiv_reader 2022/01/05
数値流体力学（CFD）法を使用して風の流れを概算するには、時間がかかる場合があります。風の流れの変化を観察しながらプロトタイプをインタラクティブに設計するためのツールを作成するには、より高速にシミュレ

arXiv

GAN

attention

domain

arXiv reaDer

augmentation

U-Net

dataset

3D

pedestrian
リンク
DIAL：リモートセンシングにおけるセマンティックセグメンテーションのためのディープインタラクティブおよびアクティブラーニング
arxiv_reader 2022/01/05
この記事では、リモートセンシング画像の正確なセグメンテーションマップを迅速に取得するために、ディープニューラルネットワークとループ内の人間との間のコラボレーションを構築することを提案します。一言で言え

arXiv

semantic segmentation

learning

human

arXiv reaDer

estimation

sparse

dataset
リンク
複数の事前トレーニングタスクによる音と視覚の表現学習
arxiv_reader 2022/01/05
さまざまな自己監視タスク（SSL）により、データからさまざまな機能が明らかになります。学習した機能表現は、ダウンストリームタスクごとに異なるパフォーマンスを示す可能性があります。この観点から、この作業

arXiv

classification

self-supervised

video

representation learning

arXiv reaDer

detection

dataset
リンク
3D医用画像描写のための深い陰的統計形状モデル
arxiv_reader 2022/01/05
解剖学的構造の3D描写は、医用画像分析の主要な目標です。ディープラーニングの前は、解剖学的制約を課し、高品質の表面を生成する統計的形状モデルがコアテクノロジーでした。ディープラーニングの前は、解剖学的

arXiv

learning

3D

representation

arXiv reaDer

CNN

segmentation

pose estimation

dataset
リンク
https://arxiv-check-250201.firebaseapp.com/each/2201.01034v2
arxiv_reader 2022/01/05
この論文では、POMが高い知覚品質を達成するのを妨げる2つの要因を発見します：1）中心指向最適化（COO）問題と2）モデルの低周波傾向。第1に、POMは、特徴空間内の位置がすべての潜在的な高解像度（H

arXiv

arXiv reaDer

human

contrastive learning
リンク
アンカーDETR：トランスベースのオブジェクト検出のためのクエリ設計
arxiv_reader 2022/01/05
本論文では、トランスベースの物体検出のための新しいクエリ設計を提案する。以前のトランスベースの検出器では、オブジェクトクエリは学習された埋め込みのセットです。ただし、学習した各埋め込みには明示的な物理

arXiv

attention

embedding

arXiv reaDer

detection

benchmark

dataset
リンク
受容野に触発されたロバストなビジュアルサンプリングモデル
網膜中心窩を模倣したスパイクカメラは、スパイクを発射することにより、ピクセルごとの輝度強度の蓄積を報告できます。時間分解能の高いバイオインスパイアードビジョンセンサーとして、コンピュータービジョンに大きな可能性を秘めています。ただし、現在のスパイクカメラのサンプリングモデルは、量子化とノイズの影響を受けやすいため、オブジェクトのテクスチャの詳細を効果的にキャプチャできません。この作業では、受容野（RVSM）に触発された堅牢な視覚サンプリングモデルを提案します。ここでは、ガウス（DoG）とガウスフィルターの差によって生成されたウェーブレットフィルターを使用して受容野をシミュレートします。逆ウェーブレット変換と同様の対応する方法を使用して、RVSMからのスパイクデータを画像に変換できます。パフォーマンスをテストするために、さまざまなモーションシーンを含む高速モーションスパイクデータセット（HM
arxiv_reader 2022/01/05
網膜中心窩を模倣したスパイクカメラは、スパイクを発射することにより、ピクセルごとの輝度強度の蓄積を報告できます。時間分解能の高いバイオインスパイアードビジョンセンサーとして、コンピュータービジョンに大

arXiv

computer vision

arXiv reaDer

quantization

dataset
リンク
クラス増分セグメンテーションのための弱教師あり継続学習
arxiv_reader 2022/01/05
転移学習は、既存の深層学習モデルをリモートセンシングの新しいユースケースに適応させる強力な方法です。セマンティックセグメンテーション用にすでにトレーニングされたニューラルネットワークから始めて、弱い監

arXiv

semantic segmentation

transfer learning

arXiv reaDer

weakly-supervised

regularization

dataset
リンク
ディープの分解：ディープCNNでのクラス固有のフィルターの検索
arxiv_reader 2022/01/05
ディープニューラルネットワークの解釈可能性は、主要な調査分野になっています。これらのネットワークは多くのタスクで最先端の精度を達成していますが、それらの決定を解釈して説明することは非常に困難です。この

arXiv

convolutional

manifold

arXiv reaDer

CNN
リンク
陰関数を学習することによるマルチビュー画像からの詳細な顔の形状の回復
arxiv_reader 2022/01/05
キャリブレーションされたマルチビュー画像のセットから詳細な顔の形状を復元することは、その幅広いアプリケーションにとって価値があります。従来のマルチビューステレオ（MVS）手法では、最適化手法を採用して

arXiv

learning

face

arXiv reaDer

stereo

CNN

3D

dataset
リンク
MoCoPnet：赤外線スモールターゲット超解像のための局所運動とコントラスト事前分布の調査
arxiv_reader 2022/01/05
赤外線スモールターゲット超解像（SR）は、低解像度のターゲットから高コントラストのターゲットを使用して、信頼性が高く詳細な高解像度の画像を復元することを目的としています。赤外線の小さなターゲットは色や

arXiv

residual

convolutional

video

attention

domain

arXiv reaDer

detection

super-resolution

spatio-temporal
リンク
ディープニューラルネットワークは、セマンティックセグメンテーションでノイズの多いラベルからメタ構造を学習します
arxiv_reader 2022/01/05
ノイズの多いラベルからディープニューラルネットワーク（DNN）がどのように学習するかは、画像分類では広く研究されていますが、画像セグメンテーションではほとんど研究されていません。これまでのところ、ノイ

arXiv

semantic segmentation

learning

classification

DNN

arXiv reaDer

unsupervised
リンク
ディープメトリック学習のための新しいクラスを生成することを学ぶ
arxiv_reader 2022/01/05
ディープメトリック学習は、トレーニング中にクラスが表示されない場合でも、データ間の距離がクラスの同等性を反映する埋め込みスペースを学習することを目的としています。ただし、トレーニングで利用できるクラス

arXiv

metric learning

generative

embedding

arXiv reaDer

augmentation

benchmark

dataset
リンク
複数のソースからのクロスドメイン分類のためのドメイン固有の分布と分類子の調整
arxiv_reader 2022/01/05
教師なしドメイン適応（UDA）アルゴリズム、つまりソースドメインからのラベル付きデータのみが近年活発に研究されていますが、ほとんどのアルゴリズムと理論結果は、単一ソースの教師なしドメイン適応（SUDA

arXiv

learning

classification

dataset

representation

arXiv reaDer

benchmark

domain adaptation

unsupervised
リンク
クロスドメイン画像分類のためのマルチ表現適応ネットワーク
arxiv_reader 2022/01/05
画像分類では、十分なラベルを取得するのに費用と時間がかかることがよくあります。この問題を解決するために、ドメイン適応は、類似した性質であるが異なるドメインからの大量のラベル付きデータを前提として、魅力

arXiv

transfer learning

classification

representation

arXiv reaDer

benchmark

domain adaptation

dataset
リンク
注意メカニズムは、ハイパースペクトル画像分類のためのハイブリッド高密度ネットワークと一致します
arxiv_reader 2022/01/05
確かに、畳み込みニューラルネットワーク（CNN）の方が適しています。ただし、カーネルサイズが固定されていると、従来のCNNは具体的すぎて、柔軟性も機能学習にも役立ちません。そのため、分類の精度に影響を

arXiv

learning

classification

attention

arXiv reaDer

CNN

3D

dataset
リンク
多様なビデオキャプションのための変分スタックローカルアテンションネットワーク
arxiv_reader 2022/01/05
自然言語で時空間イベントを説明する一方で、ビデオキャプションモデルは主にエンコーダの潜在的な視覚的表現に依存しています。エンコーダー-デコーダーモデルの最近の進歩は、主にデコーダーとの線形相互作用にお

arXiv

representation

attention

domain

arXiv reaDer

spatio-temporal

metric

pooling

captioning

dataset
リンク
PyramidTNT：PyramidアーキテクチャによるTransformer-in-Transformerベースラインの改善
PyramidTNT：PyramidアーキテクチャによるTransf ormer-in-Transf ormerベースラインの改善 PyramidTNT: Improved Transf ormer-in-Transf ormer Baselines with Pyramid Architecture Transf ormerネットワークは、コンピュータービジョンタスクで大きな進歩を遂げました。 Transf ormer-in-Transf ormer（TNT）アーキテクチャは、内部トランスと外部トランスを利用して、ローカル表現とグローバル表現の両方を抽出します。この作業では、2つの高度な設計を導入することによって新しいTNTベースラインを提示します：1）ピラミッドアーキテクチャと2）畳み込みステム。新しい「PyramidTNT」は、階層表現を確立することにより、元のTNTを大幅に改善します。 Pyra
arxiv_reader 2022/01/05
Transformerネットワークは、コンピュータービジョンタスクで大きな進歩を遂げました。 Transformer-in-Transformer（TNT）アーキテクチャは、内部トランスと外部トランス

arXiv

convolutional

computer vision

representation

arXiv reaDer

transformer
リンク
水中物体の分類と検出：最初の結果と未解決の課題
arxiv_reader 2022/01/05
この作業では、水中環境でのオブジェクト検出の問題を確認します。この困難な環境に適用した場合のコンピュータービジョンコミュニティにおける従来の最先端（SOTA）アルゴリズムの欠点を分析および定量化し、将

arXiv

classification

computer vision

arXiv reaDer

detection

dataset
リンク
StyleM：対照的なN-gramで構築された画像キャプションの定型化されたメトリック
arxiv_reader 2022/01/05
このホワイトペーパーでは、マシンで生成されたキャプションとグラウンドトゥルースの定型化されたキャプションの間の関連付けを評価するための2つの自動評価メトリックであるOnlyStyleとStyleCID

arXiv

arXiv reaDer

metric

captioning

contrastive
リンク
ミニからミニマックス最適化までの加速されたゼロ次および一次運動量法
arxiv_reader 2022/01/05
この論文では、非凸ミニ最適化とミニマックス最適化の両方のための加速されたゼロ次および一次運動量法のクラスを提案します。具体的には、ブラックボックスのミニ最適化のための新しい加速ゼロ次運動量（Acc-Z

arXiv

gradient

DNN

arXiv reaDer

adversarial
リンク
女性の安全を理解するために、暗い場所の写真をキャプションに変換するインタラクティブアテンションAI
Interactive Attention AI to translate low light photos to captions for night scene understanding in women safety 画像キャプションと低照度画像エンハンスメントのディープラーニングベースのモデルには驚くべき進歩があります。この論文は、文学で初めて、夜のシーンを文章に変換するディープラーニングモデルを開発し、視覚障害のある女性の安全におけるAIアプリケーションの新しい可能性を開きます。画像キャプションと視覚的な質問応答に触発されて、新しいインタラクティブ画像キャプションが開発されました。ユーザーは、注意スコアに影響を与えることで、選択した関心のある人物にAIを集中させることができます。注意コンテキストベクトルは、CNN特徴ベクトルとユーザー提供の開始語から計算されます。 Encode
arxiv_reader 2022/01/05
画像キャプションと低照度画像エンハンスメントのディープラーニングベースのモデルには驚くべき進歩があります。この論文は、文学で初めて、夜のシーンを文章に変換するディープラーニングモデルを開発し、視覚障害

arXiv

learning

attention

arXiv reaDer

person

CNN

captioning
リンク
ナノスケール顕微鏡におけるAIの視覚化
arxiv_reader 2022/01/05
人工知能とナノテクノロジーは、人類の未来にとって有望な分野です。ディープラーニングベースのコンピュータービジョンは、医学から自動車まで多くの分野で応用されていますが、ナノテクノロジーへの応用は、新しい

arXiv

learning

convolutional

computer vision

classification

representation

arXiv reaDer

explainable

CNN

dataset
リンク
癌検出のための畳み込みニューラルネットワークを使用した染色正規化乳房組織病理学画像認識
arxiv_reader 2022/01/05
デジタルパソロジーにおけるコンピューター支援診断は、より効率的で客観的な医療診断を提供できるため、広く普及しています。最近の進歩により、確立された深層学習パラダイムである畳み込みニューラルネットワーク

arXiv

transfer learning

classification

arXiv reaDer

detection

augmentation

CNN

dataset
リンク
HWRCNet：CNN-BiLSTMネットワークを使用したJPEG圧縮ドメインでの手書き単語認識
arxiv_reader 2022/01/05
ディープラーニングを使用した画像からの手書き単語認識は、有望なパフォーマンスを備えた活発な研究分野です。実際のシナリオでは、セキュリティ上の理由から、圧縮ドメインで手書き画像を処理する必要がある場合が

arXiv

RNN

learning

domain

arXiv reaDer

CNN
リンク
実世界のシーンでの合成画像のシャドウ生成
arxiv_reader 2022/01/05
画像合成は、前景オブジェクトを背景画像に挿入することを目的としています。以前のほとんどの画像合成方法は、前景の背景への影の影響を無視しながら、前景を背景と互換性があるように調整することに焦点を合わせて

arXiv

arXiv reaDer

synthesis

dataset
リンク
データが限られている外部注意支援多相脾臓血管損傷セグメンテーション
arxiv_reader 2022/01/05
脾臓は、鈍的腹部外傷で最も一般的に損傷する固形臓器の1つです。脾臓血管損傷のための多相CTからの自動セグメンテーションシステムの開発は、臨床意思決定支援と結果予測を改善するための重症度評価を増強するこ

arXiv

GAN

attention

CT

arXiv reaDer

synthesis

augmentation

segmentation

dataset
リンク
畳み込み正規化：深い畳み込みネットワークのロバスト性とトレーニングの改善
arxiv_reader 2022/01/05
正規化手法は、最新の畳み込みニューラルネットワーク（ConvNets）の基本コンポーネントになっています。特に、最近の多くの研究は、重みの直交性を促進することが、深いモデルのトレーニングとロバスト性の

arXiv

classification

GAN

domain

arXiv reaDer

CNN

sparse
リンク
幾何学を意識した敵対的学習による動的オブジェクト除去と時空間RGB-Dインペインティング
arxiv_reader 2022/01/05
動的オブジェクトは、ロボットの環境認識に大きな影響を与え、ローカリゼーションやマッピングなどの重要なタスクのパフォーマンスを低下させます。この作業では、動的オブジェクトによって遮られた領域でもっともら

arXiv

semantic segmentation

RGB-D

pose

localization

arXiv reaDer

recurrent

spatio-temporal

adversarial

dataset
リンク
3D頭頸部癌コンピュータ断層撮影画像における被膜外伸展同定のための勾配マッピングガイド付きの説明可能なディープニューラルネットワーク
arxiv_reader 2022/01/05
頭頸部扁平上皮癌（HNSCC）の診断と治療管理は、腫瘍とリンパ節の特徴を特定するための定期的な診断頭頸部コンピューター断層撮影（CT）スキャンによって導かれます。被膜外伸展（ECE）は、HNSCCによ

arXiv

learning

identification

gradient

CT

arXiv reaDer

detection

explainable

3D
リンク
注意ベースのニューラルネットワークとベイズ最適化を使用したイネ病の検出と分類
Rice Diseases Detection and Classification Using Attention Based Neural Network and Bayesian Optimization この研究では、ベイズ最適化を使用した注意ベースの深さ方向に分離可能なニューラルネットワーク（ADSNN-BO）を提案して、イネの葉の画像からイネの病気を検出および分類します。イネの病気はしばしば収穫量の20から40％の企業生産の損失をもたらし、世界経済と非常に関連しています。迅速な病気の特定は、治療を迅速に計画し、企業の損失を減らすために重要です。イネ病の診断は今でも主に手作業で行われています。 AIを利用した迅速で正確な病気の検出を実現するために、MobileNet構造と拡張された注意メカニズムに基づくADSNN-BOモデルを提案しました。さらに、ベイズ最適化法を適用して、モデル
arxiv_reader 2022/01/05
この研究では、ベイズ最適化を使用した注意ベースの深さ方向に分離可能なニューラルネットワーク（ADSNN-BO）を提案して、イネの葉の画像からイネの病気を検出および分類します。イネの病気はしばしば収穫量

arXiv

identification

classification

attention

Bayesian

arXiv reaDer

detection

augmentation

dataset
リンク
回転-アフィン変換に対する一般的なベクトル関数のガウス-エルミートモーメント不変量
Gaussian-Hermite Moment Invariants of General Vector Functions to Rotation-Affine Transf orm データ取得技術の発達により、マルチチャネルデータが収集され、多くの分野で広く使用されています。それらのほとんどは、さまざまなタイプのベクトル関数として表現できます。関心のある特定のパターンを識別するためのベクトル関数の特徴抽出は、重要ですが困難な作業です。この論文では、一般的なベクトル関数のモーメント不変量の構築に焦点を当てます。具体的には、一般的なベクトル関数の実際の変形を記述するために回転アフィン変換を定義し、この変換モデルに対してガウス-エルミートモーメント不変量を体系的に生成する構造フレームを設計します。一般的なベクトル関数の直交モーメント不変量を構築するために、文献で均一フレームが提案されたのはこれ
arxiv_reader 2022/01/05
データ取得技術の発達により、マルチチャネルデータが収集され、多くの分野で広く使用されています。それらのほとんどは、さまざまなタイプのベクトル関数として表現できます。関心のある特定のパターンを識別するた

arXiv

classification

arXiv reaDer

detection

synthesis

3D

dataset
リンク
圧縮センシングを使用した低線量の3Dボリューム蛍光顕微鏡イメージング
arxiv_reader 2022/01/05
蛍光顕微鏡は、胚（invivo）の成長の長期的なイメージングを経時的に観察するための重要なツールです。ただし、累積暴露は、このような敏感な生きたサンプルに対して光毒性があります。ライトシート蛍光顕微鏡

arXiv

arXiv reaDer

3D

reconstruction
リンク
ドローンのインターネットにおける画像自動認識のためのロバストな半教師あり連合学習
arxiv_reader 2022/01/05
エアアクセスネットワークは、さまざまなモノのインターネット（IoT）サービスおよびアプリケーションの重要な推進力として認識されています。特に、ドローンのインターネットを中心とした空中コンピューティング

arXiv

learning

semi-supervised

drone

arXiv reaDer

UAV
リンク
ローカル方向勾配パターン：顔認識のためのローカル記述子
Local Directional Gradient Pattern: A Local Descriptor for Face Recognition この論文では、顔認識のために高階微分空間の局所パターン記述子を提案した。提案された局所方向勾配パターン（LDGP）は、4つの異なる方向で参照ピクセルの高次導関数間の関係をエンコードすることによって計算された1D局所マイクロパターンです。提案された記述子は、4つの異なる方向の参照ピクセルの高階導関数間の関係を識別して、局所的な特徴に対応するマイクロパターンを計算します。提案された記述子は、マイクロパターンの長さを大幅に短縮し、その結果、認識率を維持しながら、抽出時間とマッチング時間を短縮します。ベンチマークデータベースAT＆T、Extended Yale B、およびCMU-PIEで実施された広範な実験の結果は、提案された記述子が抽出とマッチン
arxiv_reader 2022/01/05
この論文では、顔認識のために高階微分空間の局所パターン記述子を提案した。提案された局所方向勾配パターン（LDGP）は、4つの異なる方向で参照ピクセルの高次導関数間の関係をエンコードすることによって計算

arXiv

face recognition

gradient

arXiv reaDer

benchmark
リンク
ローカル4重パターン：顔画像認識と検索のための新しい記述子
Local Quadruple Pattern: A Novel Descriptor for Facial Image Recognition and Retrieval この論文では、顔画像の認識と検索のために、新しい手作りのローカル4重パターン（LQPAT）を提案します。既存の手作りの記述子のほとんどは、ローカル近隣の限られた数のピクセルのみをエンコードします。制約のない環境では、これらの記述子のパフォーマンスは大幅に低下する傾向があります。ローカル近傍を増やす際の主な問題は、記述子の特徴の長さも増えることです。提案された記述子は、最適な長さの効率的なエンコーディング構造を定義することにより、これらの問題を克服しようとします。提案された記述子は、4倍の空間で隣接するもの間の関係をエンコードします。ローカル関係から2つのマイクロパターンが計算され、記述子が形成されます。提案された記述子
arxiv_reader 2022/01/05
この論文では、顔画像の認識と検索のために、新しい手作りのローカル4重パターン（LQPAT）を提案します。既存の手作りの記述子のほとんどは、ローカル近隣の限られた数のピクセルのみをエンコードします。制約

arXiv

arXiv reaDer

pose

face
リンク
DeepVisualInsight：深層分類トレーニングの時空間因果関係のためのタイムトラベル視覚化
arxiv_reader 2022/01/05
トレーニングプロセス中に深層学習モデルの予測がどのように形成されるかを理解することは、モデルのパフォーマンスを改善し、モデルの欠陥を修正するために重要です。特に、アクティブラーニングなどの重要なトレー

arXiv

learning

classification

representation

arXiv reaDer

spatio-temporal
リンク
オランダの1,000万棟すべての建物のLoD2およびLoD1モデルの自動3D再構築
Automated 3D reconstruction of LoD2 and LoD1 models for all 10 million buildings of the Netherlands このホワイトペーパーでは、2DビルディングポリゴンとLiDARポイントクラウドに基づいて3Dビルディングモデルを自動的に再構築するためのワークフローを紹介します。ワークフローは、さまざまな詳細レベル（LoD）でモデルを生成し、1つの一貫したソースからさまざまなアプリケーションのデータ要件をサポートします。アルゴリズムが改善された場合、または新しい入力データが利用可能になった場合に、ワークフローを堅牢にして新しい反復をすばやく実行できるようにするために、特別な注意が払われています。再構築されたデータの品質は、入力データの品質に大きく依存し、プロセスのいくつかのステップで監視されます。 3Dビュー
arxiv_reader 2022/01/05
このホワイトペーパーでは、2DビルディングポリゴンとLiDARポイントクラウドに基づいて3Dビルディングモデルを自動的に再構築するためのワークフローを紹介します。ワークフローは、さまざまな詳細レベル（

arXiv

point cloud

attention

arXiv reaDer

LiDAR

3D

reconstruction
リンク
ノイズの多い不均衡なデータを受け入れるためのサンプル損失曲線を掘り下げる
Delving into Sample Loss Curve to Embrace Noisy and Imbalanced Data 破損したラベルとクラスの不均衡は、実際に収集されたトレーニングデータで一般的に発生し、ディープニューラルネットワーク（DNN）の過剰適合につながりやすくなります。既存のアプローチは、サンプル再重み付け戦略を採用することによってこれらの問題を軽減します。これは、重み付け関数を設計することによってサンプルを再重み付けすることです。ただし、いずれか1つのタイプのデータバイアスのみを含むトレーニングデータにのみ適用できます。ただし、実際には、ラベルが破損し、テールクラスの偏ったサンプルがトレーニングデータに共存するのが一般的です。それらを同時に処理する方法は重要ですが、十分に検討されていない問題です。この論文では、これら2種類のバイアスされたサンプルは、同様の過渡
arxiv_reader 2022/01/05
破損したラベルとクラスの不均衡は、実際に収集されたトレーニングデータで一般的に発生し、ディープニューラルネットワーク（DNN）の過剰適合につながりやすくなります。既存のアプローチは、サンプル再重み付け

arXiv

learning

DNN

arXiv reaDer

synthesis

bias

benchmark
リンク
宇宙画像からの滑走路抽出と改善されたマッピング
空港の滑走路などの主要なインフラストラクチャの監視に適用される変更検出方法は、災害救援と都市計画のための重要な機能です。現在の作業は、もっともらしい滑走路マップと衛星画像の間で可逆的に変換する2つの生成的敵対的ネットワーク（GAN）アーキテクチャを識別します。同じ観点からペアの画像（衛星マップ）を使用し、Pix2Pixアーキテクチャまたは条件付きGANを使用してトレーニング機能を説明します。利用可能なペアがない場合も、同様に、4つのネットワークヘッドを備えたCycleGANアーキテクチャ（ディスクリミネーターとジェネレーターのペア）が、生の画像ピクセルからアウトラインまたはフィーチャマップへの効果的なスタイル転送を提供できることを示します。滑走路と滑走路の境界を強調するために、従来の灰色がかった黄褐色のマップパレットは必須のトレーニング入力ではありませんが、よりシャープな滑走路の境界のため
arxiv_reader 2022/01/05
空港の滑走路などの主要なインフラストラクチャの監視に適用される変更検出方法は、災害救援と都市計画のための重要な機能です。現在の作業は、もっともらしい滑走路マップと衛星画像の間で可逆的に変換する2つの生

satellite

detection

human

arXiv reaDer

arXiv

GAN

augmentation
リンク
オープンワールドオブジェクト検出の再検討
arxiv_reader 2022/01/05
オープンワールドオブジェクト検出（OWOD）は、知識が継続的に成長する実際の動的な世界をシミュレートし、既知のクラスと未知のクラスの両方を検出し、識別された未知のクラスを段階的に学習しようとします。以

arXiv

arXiv reaDer

detection

metric

benchmark
リンク
非凸スパース正則化を使用した定常フレームレット変換に基づく塩とコショウのノイズ除去方法
arxiv_reader 2022/01/05
ごま塩ノイズの除去は、画像処理における一般的な逆問題です。従来のノイズ除去方法には2つの制限があります。まず、ノイズ特性が正確に記述されていないことがよくあります。たとえば、ノイズの位置情報は無視され

arXiv

denoising

arXiv reaDer

detection

sparse

regularization
リンク
順応性畳み込みによる高速で高品質の画像ノイズ除去
arxiv_reader 2022/01/05
多くの画像処理ネットワークは、入力画像全体に静的な畳み込みカーネルの単一のセットを適用します。これは、不均一な視覚パターンで構成されることが多いため、自然画像には最適ではありません。分類、セグメンテー

arXiv

convolutional

classification

denoising

arXiv reaDer

segmentation
リンク
ナンバープレート認識におけるクロスデータセットの一般化について
arxiv_reader 2022/01/05
自動ナンバープレート認識（ALPR）システムは、ディープラーニングの進歩とデータセットの可用性の向上により、複数の地域のナンバープレート（LP）で優れたパフォーマンスを示しています。ディープALPRシ

arXiv

learning

vehicle

arXiv reaDer

dataset
リンク
3D拡張Alpha-GANを使用した合成ラット脳MRIスキャンの生成
arxiv_reader 2022/01/05
動物モデルは科学研究の不可欠な部分であり、より多くの超高磁場スキャナーが利用可能になっているため、磁気共鳴画像法（MRI）を使用した並進脳研究はますます人気が高まっています。 MRIのいくつかの欠点は

arXiv

MRI

3D

GAN

arXiv reaDer

metric

loss function

augmentation

segmentation
リンク
VisBuddy-視覚障害者のためのスマートウェアラブルアシスタント
arxiv_reader 2022/01/05
ビジョンは、私たちの周りの世界を理解する上で重要な役割を果たします。外部情報の85％以上は、ビジョンシステムを介して取得されます。それは私たちの移動性、認知、情報アクセス、そして環境や他の人々との相互

arXiv

learning

person

arXiv reaDer

detection

activity

captioning
リンク
グラフベースのセルフチューニングネットワークを介したキャリブレーションされたハイパースペクトル画像の再構成
arxiv_reader 2022/01/05
最近、ハイパースペクトルイメージング（HSI）は、特に符号化開口スナップショットスペクトルイメージング（CASSI）システムに基づくものについて、ますます研究の注目を集めています。既存のディープHSI

arXiv

learning

attention

Bayesian

pre-training

arXiv reaDer

estimation

reconstruction
リンク
選択的攻撃に基づく連想的敵対的学習
arxiv_reader 2022/01/05
人間の注意は、以前に見たのと同様の破損していない画像を思い出すことにより、画像の破損した領域に直感的に適応できます。この観察は、敵対する画像の注意を、それらのきれいな対応物を考慮することによって改善す

adversarial

few-shot

learning

detection

arXiv reaDer

attention

arXiv
リンク
新規オブジェクトを学習するためのデュアルパス構造対照埋め込み
arxiv_reader 2022/01/05
非常に少数のラベル付きサンプルから新しいクラスを学習することは、機械学習の分野でますます注目を集めています。メタ学習ベースまたは転移学習ベースのパラダイムに関する最近の研究は、優れた機能空間に関する情

representation

few-shot

arXiv reaDer

transfer learning

benchmark

attention

embedding

contrastive

arXiv
リンク
- 2022年1月6日
- 2022年1月5日
- 2022年1月4日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx