arxiv_readerのブックマーク / 2022年1月20日 - はてなブックマーク

arxiv_reader id:arxiv_reader

2022年1月20日のブックマーク (63件)

ConDor：部分形状の3Dポーズの自己監視型正規化
arxiv_reader 2022/01/20
3Dオブジェクトの理解の進歩は、一貫した位置と方向（3Dポーズ）を持つインスタンスを含む手動で正規化された形状データセットに依存しています。これにより、これらの方法を、インターネットモデルコレクション

arXiv

point cloud

self-supervised

arXiv reaDer

metric

3D

dataset

pose
リンク
顔の表情認識のための一般的な深部特徴抽出器に向けて
arxiv_reader 2022/01/20
人間の顔はかなりの量の情報を伝えます。顔の表情を通して、顔は言葉で表現することなく多くの感情を伝えることができます。視覚的感情認識は広く研究されてきました。最近、いくつかのエンドツーエンドのトレーニン

arXiv

face

arXiv reaDer

dataset

emotion

human
リンク
よく見る：ロボット操作のためのトランスフォーマーによる自己中心的ビューとサードパーソンビューのブリッジ
arxiv_reader 2022/01/20
強化学習（RL）を使用して、視覚的なフィードバックから精度ベースの操作タスクを解決する方法を学ぶことで、従来のロボットシステムに必要なエンジニアリング作業を大幅に削減できます。ただし、特に前の作業で頻

arXiv

reinforcement learning

arXiv reaDer

robot

attention

transformer
リンク
コロナKH-4（1962-1972）ステレオ画像の自動処理のためのパイプライン
arxiv_reader 2022/01/20
1962年から1972年までのコロナKH-4偵察衛星ミッションは、1.8〜7.5mの高空間分解能でパノラマステレオ画像を取得しました。 800,000以上の機密解除されたコロナ画像の可能性は、パノラマ

arXiv

stereo

arXiv reaDer

learning

satellite
リンク
自動運転車における物体検出：ステータスと未解決の課題
arxiv_reader 2022/01/20
オブジェクト検出は、監視およびセキュリティシステム、モバイルテキスト認識、MRI / CTスキャンからの病気の診断など、今日の多くの消費者向けアプリケーションの不可欠な部分となっているコンピュータビジ

arXiv

real time

arXiv reaDer

computer vision

pedestrian

vehicle

detection

autonomous driving
リンク
Q-ViT：VisionTransformerの完全に微分可能な量子化
arxiv_reader 2022/01/20
本論文では、量子化スケールとビット幅の両方が学習可能なパラメータである、Q-ViTと名付けられたビジョントランス（ViT）のための完全に微分可能な量子化法を提案する。具体的には、ViTのヘッドが異なる

arXiv

differentiable

arXiv reaDer

quantization

transformer
リンク
COVID-19患者からのウェアラブル健康データの視覚化と分析
arxiv_reader 2022/01/20
効果的な視覚化を評価して、COVID-19で入院した患者のバイタルサインを記録したマルチセンサーのリアルタイムウェアラブルデバイスからの関連する健康パターンを明らかにしました。さらに、コンプライアンス

arXiv

real time

arXiv reaDer

dataset

COVID-19

detection
リンク
GroupGazer: グループ内の参加者ごとの視線を計算するツールで、統合キャリブレーションを使用してオンラインの視線をスクリーンまたはビーマープロジェクションにマッピングします。
arxiv_reader 2022/01/20
この論文では、GroupGazeを紹介します。これは、グループ全体の注視方向と注視位置を計算するために使用できるツールです。 GroupGazerは、画像内のすべての人物の視線方向を計算し、これらの視

person

arXiv

arXiv reaDer

attention

gaze
リンク
大衆向けの半自動3Dオブジェクトキーポイント注釈と検出
arxiv_reader 2022/01/20
コンピュータビジョンデータセットを作成するには、慎重な計画と多くの時間と労力が必要です。ロボット工学の研究では、YCBオブジェクトセットなどの標準化されたオブジェクトを、オブジェクトトラッキング、ポー

arXiv

keypoint

tracking

arXiv reaDer

dataset

3D

robot

computer vision

detection

pose estimation
リンク
混合モデルとドキュメント固有の微調整を使用した中世の写本のオープンソース手書きテキスト認識
arxiv_reader 2022/01/20
このペーパーでは、ドイツの中世の写本に対する実用的でオープンソースの手書きテキスト認識（HTR）のタスクを扱います。文書固有のトレーニングを行わなくてもすぐに適用できる混合認識モデルを構築する取り組み

arXiv

arXiv reaDer
リンク
マルチアダプテーションへの自己ルール：結腸直腸癌組織検出のための教師なしドメイン適応を使用した一般化されたマルチソース特徴学習
arxiv_reader 2022/01/20
教師あり学習は、デジタル病理学の分野で取得するのに特に費用がかかるラベル付きデータの可用性によって制約されます。事前トレーニングやドメイン適応の使用にオープンソースデータを利用することは、この問題を克

arXiv

classification

self-supervised

unsupervised

domain adaptation

arXiv reaDer

dataset

learning

pre-training

detection
リンク
生物医学画像分析のための生成的敵対的ネットワークにおけるトレーニングの課題に関する調査
arxiv_reader 2022/01/20
生物医学画像分析では、深層学習手法の適用性は、利用可能な画像データの量に直接影響されます。これは、高レベルのパフォーマンスを提供するために大規模な画像データセットを必要とする深層学習モデルによるもので

GAN

arXiv

classification

arXiv reaDer

dataset

gradient

learning

domain

synthesis
リンク
CAST：トラッキングによる自己監視を使用したアニメーションでの文字のラベル付け
arxiv_reader 2022/01/20
漫画やアニメーションドメインのビデオは、実際の画像やビデオとは非常に異なる特性を持っています。さらに、このドメインにはスタイルの大きなばらつきがあります。現在のコンピュータービジョンとディープラーニン

arXiv

self-supervised

clustering

arXiv reaDer

representation

computer vision

contrastive

MOT

embedding

domain
リンク
非線形の未知の入力の可観測性と未知の入力の再構成：一般的な分析ソリューション
arxiv_reader 2022/01/20
可観測性は、動的システムの基本的な構造特性であり、入力と出力の観測からシステムを特徴付ける状態を再構築する可能性を説明します。この特性を研究し、動的システムがこの特性を満たしているかどうかをチェックで

arXiv

arXiv reaDer

reconstruction
リンク
ディープマルチビューステレオ用の深さと表面法線の信頼性ベースの反復ソルバー
arxiv_reader 2022/01/20
この論文では、深度、表面法線、およびビューごとの信頼性マップを共同で予測するディープマルチビューステレオ（MVS）システムを紹介します。私たちのアプローチの鍵は、局所的に平面の仮定に基づいてエネルギー

arXiv

stereo

differentiable

arXiv reaDer

estimation

learning

RGB-D
リンク
スマートヘルスケアのためのコンピュータビジョンを使用したヨガのポーズのリアルタイム認識
arxiv_reader 2022/01/20
今日、ヨガは多くの人々の生活の一部になっています。エクササイズとスポーツ技術支援は、ヨガのポーズの識別に実装されています。この作品では、ユーザーがリアルタイムで修正機能を使用してヨガを実行するのに役立

arXiv

real time

arXiv reaDer

dataset

computer vision

pose

learning

identification

gesture
リンク
セマンティック画像セグメンテーションのための横方向の抑制を伴う拡張畳み込み
arxiv_reader 2022/01/20
拡張畳み込みは、重みを追加したり、空間分解能を犠牲にしたりすることなく、フィルターの受容野を拡大できるため、ディープセマンティックセグメンテーションモデルで広く使用されています。ただし、拡張畳み込みフ

arXiv

pooling

arXiv reaDer

dataset

semantic segmentation

convolutional

human

benchmark
リンク
DMF-Net：偽造防止QRコードのコピー偽造識別のためのデュアルブランチマルチスケール機能フュージョンネットワーク
arxiv_reader 2022/01/20
偽造防止QRコードは、人々の仕事や生活、特に製品の包装に広く使用されています。ただし、偽造防止QRコードは、流通過程でコピーされ偽造されるリスクがあります。実際には、コピーは通常、本物の偽造防止QRコ

arXiv

learning

arXiv reaDer

identification
リンク
蒸留を使用して単一の画像から数千のクラスに外挿する
arxiv_reader 2022/01/20
ニューラルネットワークは、単一の画像から視覚世界について何を学ぶことができますか？明らかに、存在する可能性のある多数のオブジェクト、シーン、および照明条件を含めることはできませんが、すべての可能な25

arXiv

knowledge distillation

arXiv reaDer

video
リンク
効率的な注釈のためのHER2スライドのスーパーピクセルプレセグメンテーション
arxiv_reader 2022/01/20
教師あり深層学習は、組織病理学や癌研究など、さまざまなアプリケーションにわたる医療画像セグメンテーションの最先端のパフォーマンスを示しています。ただし、そのようなデータの手動注釈は非常に面倒です。この

segmentation

arXiv

clustering

arXiv reaDer

learning

denoising

embedding

domain
リンク
ニューラル常微分方程式を使用して学習したコーンビームCT再構成
arxiv_reader 2022/01/20
逆問題に対して学習された反復再構成アルゴリズムは、問題に関する分析知識をデータから学習されたモジュールと組み合わせる柔軟性を提供します。このようにして、測定データとの整合性を確保しながら、高い再構成パ

arXiv

sparse

arXiv reaDer

CT

3D

residual

reconstruction
リンク
シンプルな方が良い：変分オートエンコーダーのスペクトル正則化とアップサンプリング手法
arxiv_reader 2022/01/20
ニューラルネットワークに基づく生成モデルのスペクトル挙動の完全な特性評価は、未解決の問題のままです。最近の研究は、生成的敵対的ネットワークと、実際の画像と生成された画像の間の高周波の不一致に重点を置い

GAN

arXiv

regularization

arXiv reaDer

convolutional

synthesis
リンク
深層学習によるMRコイル外挿のための仮想コイル増強技術
arxiv_reader 2022/01/20
磁気共鳴画像法（MRI）は、広く使用されている医用画像診断法です。ただし、ハードウェア、スキャン時間、スループットの制限により、高品質のMR画像を取得することは臨床的に困難な場合があります。この記事で

arXiv

MRI

arXiv reaDer

learning

domain

augmentation

reconstruction
リンク
水中画像復元のための波長ベースの属性付きディープニューラルネットワーク
arxiv_reader 2022/01/20
背景：一般に、水中画像は、光が水中を伝播するときに光が不均一に減衰するため、コントラストが低く、色の歪みが大きくなります。さらに、減衰の程度は波長によって異なり、その結果、色が非対称に移動します。深層

arXiv

video

arXiv reaDer

dataset

semantic segmentation

learning

pose estimation

benchmark
リンク
ニューラルアクション表現におけるドメインギャップの克服
arxiv_reader 2022/01/20
動物の行動を脳の活動に関連付けることは、神経科学の基本的な目標であり、堅牢なブレインマシンインターフェイスの構築に実用的なアプリケーションがあります。ただし、個人間のドメインギャップは、ラベルのない主

arXiv

action

video

arXiv reaDer

3D

activity

pose

representation

domain

human
リンク
説明方法に基づく樹種分類のためのリモートセンシング画像の弱教師ありセマンティックセグメンテーション
arxiv_reader 2022/01/20
樹種を特定するためのピクセルベースのラベル付きトレーニングサンプルを多数収集することは、運用中の林業アプリケーションでは時間とコストがかかります。この問題に対処するために、この論文では、画像レベルのラ

arXiv

classification

arXiv reaDer

weakly-supervised

semantic segmentation

identification
リンク
キースフィアに基づく高忠実度の3Dモデル圧縮
arxiv_reader 2022/01/20
近年、ニューラル符号付き距離関数（SDF）は、3Dモデルの最も効果的な表現方法の1つになりました。ニューラルネットワークは、3D空間で連続SDFを学習することにより、特定のクエリ空間ポイントから最も近

arXiv

arXiv reaDer

dataset

3D

compression

learning

representation

reconstruction
リンク
ResUNet-CMBによる宇宙偏光回転子の再構築
arxiv_reader 2022/01/20
パリティ違反の新しい物理学または原始磁場の存在から生じる可能性のある宇宙偏光回転は、宇宙マイクロ波背景放射（CMB）のEモード偏光をBモード偏光に変換します。異方性宇宙偏光回転は、CMB偏光の統計的異

CNN

arXiv

arXiv reaDer

reconstruction
リンク
MaskALを使用した能動学習により、MaskR-CNNをトレーニングするための注釈の労力が軽減されます
arxiv_reader 2022/01/20
畳み込みニューラルネットワーク（CNN）の一般化パフォーマンスは、トレーニング画像の量、質、および多様性に影響されます。トレーニング画像には注釈を付ける必要があり、これには時間と費用がかかります。私た

arXiv

arXiv reaDer

dataset

R-CNN

CNN

learning
リンク
アクティブラーニングのための自己監視型口実タスクの使用
arxiv_reader 2022/01/20
大量のデータセットにラベルを付けるにはコストがかかります。アクティブラーニングは、ラベルのないセットから最も有益なデータのみに注釈を付けるように依頼することで、この問題に取り組むことを目的としています

segmentation

arXiv

classification

self-supervised

arXiv reaDer

learning

benchmark
リンク
TransFuse：自己監視学習を使用したUnifiedTransformerベースのImageFusion Framework
arxiv_reader 2022/01/20
画像融合は、複数のソース画像からの情報を補完的な情報と統合して、単一の画像の豊かさを向上させる手法です。タスク固有のトレーニングデータとそれに対応するグラウンドトゥルースが不十分なため、既存のエンドツ

arXiv

self-supervised

arXiv reaDer

dataset

CNN

learning

domain

transformer
リンク
垂直カットデプスによる単眼深度推定のためのグローバル-ローカルパスネットワーク
arxiv_reader 2022/01/20
単一の画像からの深度推定は、コンピュータビジョンのさまざまな分野に適用できる重要なタスクであり、畳み込みニューラルネットワークの開発とともに急速に成長しています。本論文では、ネットワークの予測精度をさ

arXiv

arXiv reaDer

dataset

monocular

estimation

computer vision

CNN

representation

augmentation

transformer
リンク
可逆MRコイル圧縮のための可変拡張ネットワーク
arxiv_reader 2022/01/20
多数のコイルは、信号対雑音比を向上させ、並列イメージングのイメージングパフォーマンスを向上させることができます。ただし、コイル数が増えるにつれて、特に一部の反復再構成では、データストレージと再構成速度

arXiv

arXiv reaDer

compression

augmentation

reconstruction
リンク
ビジョンのトランスフォーマー：調査
arxiv_reader 2022/01/20
自然言語タスクに関するTransformerモデルの驚くべき結果により、ビジョンコミュニティは、コンピュータービジョンの問題への応用を研究することに興味をそそられました。それらの顕著な利点の中で、トラ

arXiv

generative

point cloud

arXiv reaDer

computer vision

convolutional

LSTM

detection

action recognition

transformer
リンク
WebUAV-3M: 100 万規模のディープ UAV 追跡の力を明らかにするためのベンチマーク
arxiv_reader 2022/01/20
この作業では、WebUAV-3Mと呼ばれる新しい百万規模の無人航空機（UAV）追跡ベンチマークを提供します。まず、インターネットから300万フレームを超える4,485本の動画を収集します。次に、効率的

arXiv

tracking

video

arXiv reaDer

dataset

UAV

benchmark
リンク
自己監視型ディープブラインドビデオ超解像
arxiv_reader 2022/01/20
既存の深層学習ベースのビデオ超解像（SR）手法は、通常、教師あり学習アプローチに依存します。この場合、トレーニングデータは通常、既知または事前定義されたカーネル（Bicubicカーネルなど）を使用した

arXiv

optical flow

self-supervised

video

arXiv reaDer

estimation

super-resolution

learning

benchmark
リンク
Poseur：トランスフォーマーを使用した直接的な人間のポーズの回帰
arxiv_reader 2022/01/20
単一画像からの2D人間の姿勢推定への直接的な回帰ベースのアプローチを提案します。問題をシーケンス予測タスクとして定式化し、Transformerネットワークを使用して解決します。このネットワークは、ヒ

arXiv

keypoint

differentiable

arXiv reaDer

dataset

human pose estimation

representation

attention

pose estimation

transformer
リンク
医療用視覚的質問応答：調査
arxiv_reader 2022/01/20
Medical Visual Question Answering〜（VQA）は、医療用人工知能と一般的なVQAチャレンジを組み合わせたものです。自然言語での医用画像と臨床的に関連する質問を考えると、

arXiv

VQA

arXiv reaDer

dataset
リンク
フリーハンドスケッチからの3D形状再構成
arxiv_reader 2022/01/20
スケッチは、実世界のオブジェクトの最も抽象的な2D表現です。スケッチには通常、幾何学的な歪みがあり、視覚的な手がかりがありませんが、人間はスケッチから3Dオブジェクトを簡単に想像できます。これは、スケ

arXiv

arXiv reaDer

3D

representation

reconstruction
リンク
KappaFace：深い顔認識のための適応型加法角度マージン損失
arxiv_reader 2022/01/20
特徴学習は、大規模な顔認識に広く使用されている方法です。最近、マージンの大きいソフトマックス損失法により、深い顔認識が大幅に強化されました。これらの方法は、クラス内のコンパクトさとクラス間の多様性を強

arXiv

arXiv reaDer

face recognition

learning

benchmark
リンク
ディープラーニングスタイルの転送による微生物コロニーデータセットの生成
arxiv_reader 2022/01/20
完全に監視された方法で深層学習モデルをトレーニングするために使用できるペトリ皿の微生物学的画像の注釈付き合成データセットを生成するための効果的な戦略を紹介します。開発されたジェネレータは、データ拡張の

segmentation

arXiv

arXiv reaDer

dataset

computer vision

detection

domain

augmentation

synthesis
リンク
プラグアンドプレイの完全自動化された監視されていない360度の深層学習VisualDefect検出システムに向けて
arxiv_reader 2022/01/20
ほとんどの製品の品質を確保するには、視覚的な欠陥の検出が重要です。ただし、中小規模の製造業者の大多数は、依然として面倒でエラーの少ない人間による手動検査に依存しています。主な理由は次のとおりです。1）

arXiv

unsupervised

face

arXiv reaDer

learning

detection

human
リンク
JPEG一次量子化行列の推定とクラスタリングによる画像スプライシングの検出、ローカリゼーション、および帰属
arxiv_reader 2022/01/20
異なる画像領域にわたる二重JPEGアーティファクトの不整合の検出は、画像スプライシングなどのローカル画像操作を検出し、それらをローカライズするためによく使用されます。この論文では、さらに一歩進んで、ス

arXiv

localization

clustering

arXiv reaDer

estimation

compression

quantization

detection

reconstruction
リンク
Swin-Pose：SwinTransformerベースの人間のポーズ推定
畳み込みニューラルネットワーク（CNN）は、多くのコンピュータービジョンタスクで広く利用されています。ただし、CNNには固定の受信フィールドがあり、人間の姿勢推定に不可欠な長距離知覚の機能が不足しています。ピクセル間の長距離依存関係をキャプチャする機能により、最近コンピュータビジョンアプリケーションにトランスアーキテクチャが採用され、非常に効果的なアーキテクチャであることが証明されています。人間の姿勢推定におけるその能力を探求することに興味があり、したがって、特徴的なピラミッド融合構造で強化された、変圧器アーキテクチャに基づく新しいモデルを提案します。具体的には、事前にトレーニングされたSwin Transf ormerをバックボーンとして使用し、入力画像から特徴を抽出します。特徴ピラミッド構造を利用して、さまざまな段階から特徴マップを抽出します。機能を融合することにより、モデルはキーポイン
arxiv_reader 2022/01/20
畳み込みニューラルネットワーク（CNN）は、多くのコンピュータービジョンタスクで広く利用されています。ただし、CNNには固定の受信フィールドがあり、人間の姿勢推定に不可欠な長距離知覚の機能が不足してい

arXiv

keypoint

arXiv reaDer

human pose estimation

computer vision

CNN

pre-training

pose estimation

transformer
リンク
オートエンコーダに基づくオンラインディープラーニング
arxiv_reader 2022/01/20
オンライン学習は、大量のリアルタイムで高速なデータをスケッチするための重要な技術的手段です。この方向性は注目を集めていますが、この分野のほとんどの文献は、次の3つの問題を無視しています。例のクラスラベ

arXiv

classification

real time

arXiv reaDer

dataset

learning

denoising

representation

attention

reconstruction
リンク
肺超音波AIにおける胸膜と脂肪の役割
arxiv_reader 2022/01/20
この論文では、肺超音波AI分析における胸膜と脂肪組織の重要性を研究します。曲線超音波プローブの代わりに高周波線形（HFL）を使用した場合のより目立つ外観を強調し、HFLがより良い胸膜の詳細を明らかにす

arXiv

arXiv reaDer
リンク
TriCoLo：検索を形作るためのきめの細かいテキストの三峰性の対照的な損失
TriCoLo: Trimodal Contrastive Loss for Fine-grained Text to Shape Retrieval マルチモーダルデータに対する共同埋め込みを学習するための対照的な損失に関する最近の研究は、検索や分類などの下流のタスクで成功しています。一方、3D形状とテキストの共同表現学習の研究は、これまで、表現間の複雑な注意のモデリング、またはマルチタスク学習による埋め込みの改善に主に焦点を当ててきました。大規模なバッチ対照学習により、複雑な注意メカニズムや損失なしにテキスト形状検索でSoTAを達成できることを示します。 3Dおよびテキスト表現のこれまでの研究では、ボクセルまたはテキスト付きのマルチビュー画像のいずれかを使用したバイモーダル表現学習にも焦点が当てられていました。この目的のために、すべてのモダリティに対してさらに高いパフォーマンスとより良
arxiv_reader 2022/01/20
マルチモーダルデータに対する共同埋め込みを学習するための対照的な損失に関する最近の研究は、検索や分類などの下流のタスクで成功しています。一方、3D形状とテキストの共同表現学習の研究は、これまで、表現間

arXiv

classification

representation learning

arXiv reaDer

contrastive learning

3D

multi-task

embedding

attention
リンク
肺超音波のより良い重症度スコアリングのための弱く教師あり対照学習
Weakly Supervised Contrastive Learning for Better Severity Scoring of Lung Ultrasound COVID-19のパンデミックの発生とともに、超音波は患者のベッドサイドモニタリングのための効果的なツールとして浮上してきました。このため、AIベースの診断と分析に使用できる大量の肺超音波スキャンが利用可能になりました。超音波スキャンの外観のスコアリングに依存する、いくつかのAIベースの患者重症度スコアリングモデルが提案されています。 AIモデルは、標準化された視覚的特徴に基づいて手動でラベル付けされた超音波外観の重症度スコアを使用してトレーニングされます。ビデオクリップ内のすべての超音波フレームにラベルを付けるという課題に対処します。私たちの対照的な学習方法は、ビデオクリップの重大度ラベルを個々のフレームのノイズの多い
arxiv_reader 2022/01/20
COVID-19のパンデミックの発生とともに、超音波は患者のベッドサイドモニタリングのための効果的なツールとして浮上してきました。このため、AIベースの診断と分析に使用できる大量の肺超音波スキャンが利

arXiv

video

arXiv reaDer

dataset

weakly-supervised

contrastive learning

COVID-19
リンク
肺スワッピングオートエンコーダ：胸部X線写真の解きほぐされた構造-テクスチャ表現の学習
arxiv_reader 2022/01/20
胸部X線写真（CXR）の適切にラベル付けされたデータセットは、注釈のコストが高いため、取得が困難です。したがって、ラベル付けされたデータがないタスクに利益をもたらすために、教師なしの方法で堅牢で転送可

arXiv

generative

disentangling

unsupervised

adversarial

arXiv reaDer

dataset

COVID-19

domain

augmentation
リンク
Dashcamビデオを使用した自動地図更新
arxiv_reader 2022/01/20
自動運転には、セマンティックランドマークに関する正確で最新の情報を提供する3Dマップが必要です。レーザースキャナーと比較してカメラの可用性が高く、コストが低いため、ビジョンベースのマッピングソリューシ

arXiv

localization

point cloud

landmark

clustering

arXiv reaDer

3D

detection

autonomous driving

attention
リンク
OSSID：ポーズ推定による（およびそのための）オンライン自己監視インスタンス検出
arxiv_reader 2022/01/20
多くのロボット操作アルゴリズムでは、リアルタイムのオブジェクトポーズ推定が必要です。ただし、オブジェクトのポーズを推定するための最先端の方法は、特定のオブジェクトのセット用にトレーニングされています。

arXiv

self-supervised

real time

arXiv reaDer

zero-shot

dataset

robot

detection

pose estimation

human
リンク
組織病理学的画像を使用したAIベースの癌の検出と分類：系統的レビュー
AI-based Carcinoma Detection and Classification Using Histopathological Images: A Systematic Review 組織病理学的画像分析は、癌を診断するためのゴールドスタンダードです。癌腫は癌のサブタイプであり、すべての癌症例の80％以上を占めています。扁平上皮癌と腺癌は、生検スライドの顕微鏡検査によって診断された癌の2つの主要なサブタイプです。ただし、手動の顕微鏡評価は主観的で時間のかかるプロセスです。多くの研究者が、癌腫の検出と分類を自動化する方法を報告しています。癌腫診断の自動化における人工知能（AI）の使用の増加は、ディープネットワークモデルの使用の大幅な増加も明らかにしています。この系統的文献レビューでは、組織病理学的画像を使用した癌腫診断で報告された最先端のアプローチの包括的なレビューを提示しま
arxiv_reader 2022/01/20
組織病理学的画像分析は、癌を診断するためのゴールドスタンダードです。癌腫は癌のサブタイプであり、すべての癌症例の80％以上を占めています。扁平上皮癌と腺癌は、生検スライドの顕微鏡検査によって診断された

arXiv

classification

arXiv reaDer

dataset

detection
リンク
セマンティックガイド付き単一画像反射除去
arxiv_reader 2022/01/20
反射は、ガラス窓の後ろのシーンをキャプチャする画像で一般的です。これは、視覚的な障害であるだけでなく、他のコンピュータビジョンアルゴリズムのパフォーマンスにも影響を及ぼします。単一画像の反射の除去は、

arXiv

arXiv reaDer

dataset

computer vision

human
リンク
超音波画像テクスチャ特徴に基づく乳がん診断のための説明可能なアンサンブル機械学習
Explainable Ensem ble Machine Learning for Breast Cancer Diagnosis based on Ultrasound Image Texture Features 画像分類は、乳がん診断の予測モデルを構築するために広く使用されています。ほとんどの既存のアプローチは、そのような診断パイプラインを構築するために、圧倒的に深い畳み込みネットワークに依存しています。これらのモデルアーキテクチャは、パフォーマンスは優れていますが、予測の背後にある内部ロジックへの最小限の洞察を提供するブラックボックスシステムです。予測の説明可能性は癌診断などのアプリケーションに不可欠であるため、これは大きな欠点です。この論文では、超音波画像に基づく乳がん診断のための説明可能な機械学習パイプラインを提案することにより、この問題に対処します。超音波画像の1次および2次
arxiv_reader 2022/01/20
画像分類は、乳がん診断の予測モデルを構築するために広く使用されています。ほとんどの既存のアプローチは、そのような診断パイプラインを構築するために、圧倒的に深い畳み込みネットワークに依存しています。これ

arXiv

classification

explainable

arXiv reaDer

convolutional

learning
リンク
全体的なシーンの理解に向けて：セマンティックセグメンテーションおよびそれ以降
Towards holistic scene understanding: Semantic segmentation and beyond この論文は、視覚的なシーンの理解に取り組み、セグメンテーションのパフォーマンスと一般化、ネットワークのトレーニング効率、および全体的な理解を強化します。まず、ストリートシーンのコンテキストでセマンティックセグメンテーションを調査し、さまざまなデータセットの組み合わせでセマンティックセグメンテーションネットワークをトレーニングします。第2章では、単一の畳み込みバックボーン上で階層分類器のフレームワークを設計し、ピクセルラベル付きデータセットの組み合わせでエンドツーエンドでトレーニングし、一般化可能性と認識可能なセマンティック概念の数を改善します。第3章では、弱い監視によるセマンティックセグメンテーションの強化に焦点を当て、ピクセルごとの監視だけでなく、
arxiv_reader 2022/01/20
この論文は、視覚的なシーンの理解に取り組み、セグメンテーションのパフォーマンスと一般化、ネットワークのトレーニング効率、および全体的な理解を強化します。まず、ストリートシーンのコンテキストでセマンティ

arXiv reaDer

dataset

arXiv

panoptic segmentation

semantic segmentation

metric

convolutional

reasoning

weakly-supervised

detection
リンク
対照学習は心エコー画像の左心室セグメンテーションに適していますか？
Is Contrastive Learning Suitable for Left Ventricular Segmentation in Echocardiographic Images? 対照学習は、ラベル付けされたデータへのアクセスが制限されている多くのアプリケーションで役立つことが証明されています。注釈付きデータの欠如は、臨床専門家に大量のデータに手動で注釈を付けることが難しいため、医療画像のセグメンテーションで特に問題になります。そのようなタスクの1つは、心臓の超音波画像における心臓構造のセグメンテーションです。この論文では、対照的な事前トレーニングが心エコー画像の左心室のセグメンテーションに役立つかどうかを議論します。さらに、これが2つのセグメンテーションネットワークであるDeepLabV3と、一般的に使用されるセグメンテーションネットワークであるUNetに与える影響を調査しま
arxiv_reader 2022/01/20
対照学習は、ラベル付けされたデータへのアクセスが制限されている多くのアプリケーションで役立つことが証明されています。注釈付きデータの欠如は、臨床専門家に大量のデータに手動で注釈を付けることが難しいため

self-supervised

arXiv reaDer

dataset

arXiv

contrastive learning

segmentation
リンク
SAR画像での航空機検出のための注意機能の改良と位置合わせネットワーク
arxiv_reader 2022/01/20
合成開口レーダー（SAR）画像での航空機の検出は、航空機の外観が非常に離散的で、クラス内の変動が明らかで、サイズが小さく、背景の干渉が深刻なため、SAR自動目標認識（SAR ATR）領域では困難な作業

dataset

detection

synthesis

arXiv

R-CNN

arXiv reaDer

attention

single-shot

convolutional
リンク
RePre：再構成的な事前トレーニングによる自己監視型ビジョントランスフォーマーの改善
arxiv_reader 2022/01/20
最近、自己監視型ビジョントランスフォーマーは、その印象的な表現学習能力で前例のない注目を集めています。ただし、主な方法である対照学習は、主に、画像のグローバルな理解を学習するインスタンス識別口実タスク

representation learning

self-supervised

transformer

arXiv

pre-training

contrastive learning

arXiv reaDer

attention
リンク
STURE：オンラインマルチオブジェクトトラッキングにおけるロバストなデータアソシエーションのための時空間相互表現学習
arxiv_reader 2022/01/20
オンラインマルチオブジェクトトラッキング（MOT）は、コンピュータービジョンとインテリジェントな車両プラットフォームの長年のタスクです。現在、主なパラダイムは検出による追跡であり、このパラダイムの主な

vehicle

representation learning

benchmark

metric

detection

arXiv

MOT

arXiv reaDer

computer vision
リンク
H＆E-敵対的ネットワーク：ヘマトキシリン＆エオシン回帰を通じて染色不変の特徴を学習する畳み込みニューラルネットワーク
arxiv_reader 2022/01/20
計算病理学は、全スライド画像（WSI）と呼ばれる大きなデジタル化された組織病理学画像を自動的に分析するアルゴリズムを開発することを目的としたドメインです。 WSIは、特定の構造を可視化するために染色さ

classification

dataset

CNN

arXiv reaDer

arXiv

domain
リンク
GradTail：勾配ベースのサンプル重み付けを使用したロングテールデータの学習
arxiv_reader 2022/01/20
ロングテールのトレーニングデータ分布に直面して、勾配を使用してモデルのパフォーマンスをその場で改善するアルゴリズムであるGradTailを提案します。収束モデル（場合によっては過剰適合）で動作する従来

face

arXiv reaDer

arXiv

classification

gradient

learning
リンク
GAMMA：自動運転のための一般的なエージェントモーションモデル
arxiv_reader 2022/01/20
この論文では、自動運転の大規模なリアルタイムシミュレーションと計画を可能にする一般的なモーション予測モデルであるGAMMAを紹介します。 GAMMAは、異種のインタラクティブなトラフィックエージェント

benchmark

simulation

human

arXiv reaDer

arXiv

autonomous driving

dataset

real time
リンク
少ないほど多い場合：入力を単純化すると、ニューラルネットワークの理解が容易になります
arxiv_reader 2022/01/20
ニューラルネットワークの画像分類器は、より単純な入力にどのように応答しますか？そして、そのような応答は学習プロセスについて何を明らかにしますか？これらの質問に答えるには、入力の単純さ（または逆に複雑さ

generative

arXiv reaDer

arXiv

dataset

classification

learning
リンク
- 2022年1月21日
- 2022年1月20日
- 2022年1月19日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx