arxiv_readerのブックマーク / 2021年11月10日 - はてなブックマーク

arxiv_reader id:arxiv_reader

2021年11月10日のブックマーク (97件)

データ拡張は堅牢性を向上させることができます
arxiv_reader 2021/11/10
敵対的な訓練は、訓練中に頑強なテストの精度が低下し始める現象である、頑健な過剰適合に悩まされています。このホワイトペーパーでは、一般的なデータ拡張スキームを使用して、ロバストな過剰適合を減らすことに焦

adversarial

arXiv reaDer

arXiv

augmentation

dataset
リンク
密なメッシュで運ばれる局所画像の特徴を備えた単眼の人間の形とポーズ
arxiv_reader 2021/11/10
ピクセル整列された局所画像特徴を使用して、単眼入力からの人間の形状および姿勢推定のためのグラフ畳み込みベースのアプローチを改善することを提案する。単一の入力カラー画像が与えられた場合、人間の形状と姿勢

benchmark

arXiv

monocular

mesh

arXiv reaDer

human

GCN

CNN

pose estimation
リンク
倒立振子のPIDおよびファジィ制御システムの設計と分析
arxiv_reader 2021/11/10
倒立振子は非線形の不平衡システムであり、安定性と平衡を達成するためにモーターを使用して制御する必要があります。倒立振子は、レゴとレゴマインドストームNXTを使用して構築されています。レゴマインドストー

arXiv reaDer

robot

computer vision

arXiv
リンク
ダイナミックアクティブピクセルビジョンセンサー（Davis）のフィードバックを使用して、リアルタイムでスリップを防止します
arxiv_reader 2021/11/10
この論文の目的は、リアルタイムのフィードバックでスリップと接触力を検出するアプローチを説明することです。この斬新なアプローチでは、DAVISカメラは、その高速なプロセス速度と高解像度により、視覚触覚セ

real time

arXiv reaDer

robot

arXiv
リンク
影を除去するための物理ベースの影画像分解
arxiv_reader 2021/11/10
影除去のための新しい深層学習法を提案します。影の形成の物理モデルに触発されて、線形照明変換を使用して、画像内の影の効果をモデル化します。これにより、影のない画像、影のパラメータ、およびマットレイヤーの

video

arXiv reaDer

arXiv

learning

weakly-supervised

dataset
リンク
スライスされた再帰トランス
arxiv_reader 2021/11/10
追加のパラメーターを使用せずにパラメーターの使用率を向上させることができる、ビジョントランスフォーマーのきちんとした効果的な再帰操作を紹介します。これは、トランスネットワークの深さ全体で重みを共有する

arXiv reaDer

transformer

arXiv
リンク
STDPを使用したイベントデータの教師なしスパイクインスタンスセグメンテーション
arxiv_reader 2021/11/10
スパイキングニューラルネットワーク（SNN）とニューロモルフィックエンジニアリングの分野は、機械学習（ML）とコンピュータービジョン（CV）の問題へのアプローチ方法にパラダイムシフトをもたらしました。

detection

SNN

arXiv

arXiv reaDer

computer vision

CNN

segmentation

face recognition

sparse
リンク
自動グラフエンコーダー-ニューラルネットワークプルーニング用デコーダー
arxiv_reader 2021/11/10
モデル圧縮は、コンピューティングリソースとストレージリソースが限られているモバイルデバイスにディープニューラルネットワーク（DNN）を展開することを目的としています。ただし、既存のモデル圧縮方法のほと

embedding

reinforcement learning

DNN

arXiv reaDer

GNN

arXiv

domain

compression

pruning
リンク
絵を描くことを学ぶ：スケッチによる創発的なコミュニケーション
arxiv_reader 2021/11/10
視覚的コミュニケーションが文字言語に先行し、その基礎を提供したという証拠は、遠い祖先の痕跡を描いた洞窟や岩絵などの形で、先史時代にまでさかのぼります。創発的コミュニケーション研究は、エージェントが協調

differentiable

bias

arXiv reaDer

arXiv

learning
リンク
プレノプティックカメラのキャリブレーションにブラー情報を活用
arxiv_reader 2021/11/10
この論文では、プレノプティックカメラの新しいキャリブレーションアルゴリズム、特に、生の画像のみを使用して、いくつかのタイプのマイクロレンズが使用されるマルチフォーカス構成を紹介します。現在のキャリブレ

arXiv reaDer

arXiv
リンク
弱くラベル付けされたビデオを使用した疼痛強度推定の順序回帰のためのディープDA
arxiv_reader 2021/11/10
ビデオの表情からの痛みの強さの自動推定は、ヘルスケアアプリケーションで計り知れない可能性を秘めています。ただし、ドメイン適応（DA）は、ソースドメインとターゲットドメインでキャプチャされたビデオデータ

adversarial

estimation

domain adaptation

localization

attention

arXiv reaDer

representation

arXiv

weakly-supervised

dataset
リンク
大腿骨骨折分類を改善するためのカリキュラム学習：事前の知識と不確実性を伴うデータのスケジューリング
arxiv_reader 2021/11/10
X線画像から近位大腿骨骨折を適切に分類することは、治療法の選択と患者の臨床転帰にとって非常に重要です。骨折の位置と複雑さに応じて画像をタイプとサブタイプに分類する階層的な知識ツリーを記述する、一般的に

classification

arXiv

arXiv reaDer

CNN

learning

dataset
リンク
次元感情認識のためのクロスアテンションオーディオビジュアルフュージョン
arxiv_reader 2021/11/10
マルチモーダル分析は、孤立したユニモーダルアプローチよりも感情認識の全体的な精度を向上させることができるため、最近、感情コンピューティングに大きな関心を集めています。マルチモーダル感情認識の最も効果的

video

saliency

attention

arXiv reaDer

representation

emotion

arXiv

recurrent

face
リンク
合成的に訓練された深い畳み込みネットワークで人体部分をセグメント化することを学ぶ
arxiv_reader 2021/11/10
この論文では、合成データのみを使用してトレーニングされたディープ畳み込みニューラルネットワークに基づく人体部分セグメンテーションの新しいフレームワークを紹介します。提案されたアプローチは、人体部分の実

arXiv

arXiv reaDer

synthesis

human

CNN

learning

segmentation

dataset
リンク
熱データは検出システムの信頼性を高めますか？
arxiv_reader 2021/11/10
ディープラーニングベースの検出ネットワークは、自動運転システム（ADS）で目覚ましい進歩を遂げました。 ADSは、さまざまな周囲照明や悪天候に対して信頼性の高いパフォーマンスを発揮する必要があります。

detection

autonomous driving

arXiv reaDer

arXiv

learning
リンク
堅牢な教師なしビデオ人物の再識別の活用
arxiv_reader 2021/11/10
教師なしビデオ人物再識別（reID）メソッドは、通常、グローバルレベルの機能に依存します。また、多くの監視対象reIDメソッドは、ローカルレベルの機能を採用し、パフォーマンスを大幅に向上させました。た

person

video

benchmark

arXiv reaDer

representation

arXiv

learning

unsupervised

re-id
リンク
RGB-D顕著な物体検出のためのモーダル適応ゲート記録ネットワーク
arxiv_reader 2021/11/10
RGB-D情報に基づくマルチモーダル顕著なオブジェクト検出モデルは、実世界でより優れた堅牢性を備えています。ただし、機能融合フェーズで効果的なマルチモーダル情報のバランスをより適切に調整することは重要

detection

RGB-D

benchmark

saliency

arXiv reaDer

arXiv
リンク
倫理的に調整されたディープラーニング：偏りのない顔の美的予測
arxiv_reader 2021/11/10
顔の美しさの予測（FBP）は、顔の魅力を自動的に評価するマシンの開発を目的としています。過去には、これらの結果は人間の評価と高い相関関係があり、したがって注釈付けのバイアスとも相関関係がありました。人

arXiv

bias

arXiv reaDer

human

CNN

learning

face
リンク
ConformalLayers：連想層を持つ非線形シーケンシャルニューラルネットワーク
arxiv_reader 2021/11/10
畳み込みニューラルネットワーク（CNN）は広く適用されています。ただし、CNNが大きくなると、算術演算の数とメモリフットプリントも増加します。さらに、典型的な非線形活性化関数は、連続する層によってエン

arXiv

arXiv reaDer

pooling

domain

CNN
リンク
敵対的ロバストネスの統一されたゲーム理論的解釈
arxiv_reader 2021/11/10
このホワイトペーパーでは、さまざまな敵対的攻撃と防御方法を説明するための統一されたビュー、つまりDNNの入力変数間の多次相互作用のビューを提供します。マルチオーダーの相互作用に基づいて、敵対的な攻撃が

adversarial

bias

DNN

interpretation

arXiv reaDer

arXiv
リンク
フローガイダンスによる画像再スケーリングの限界に近づく
arxiv_reader 2021/11/10
画像のダウンスケーリングとアップスケーリングは、2つの基本的な再スケーリング操作です。画像が縮小されると、情報が失われるため、拡大によって再構築することは困難です。これらの2つのプロセスの互換性を高め

representation

reconstruction

arXiv reaDer

arXiv
リンク
コンピュータビジョンと数学的方法を使用した工場機械のパーセンテージでの残留量
arxiv_reader 2021/11/10
AIの開発が本格化して以来、コンピュータービジョンは繁栄してきました。ディープラーニング技術の使用は、コンピューター科学者が解決策を考えた最も一般的な方法です。ただし、深層学習手法は、手動処理よりもパ

arXiv reaDer

computer vision

arXiv

learning

residual
リンク
SegmentMeIfYouCan：異常セグメンテーションのベンチマーク
arxiv_reader 2021/11/10
最先端のセマンティックまたはインスタンスセグメンテーションディープニューラルネットワーク（DNN）は通常、セマンティッククラスの閉集合でトレーニングされます。そのため、以前は見られなかったオブジェクト

metric

benchmark

DNN

OOD

arXiv reaDer

synthesis

arXiv

segmentation

dataset
リンク
生のノイズ除去におけるノイズ合成とモデリングの再考
arxiv_reader 2021/11/10
大規模な実際の生画像のノイズ除去データセットがないため、ノイズ除去モデルをトレーニングするために現実的な生画像のノイズを合成するという課題が生じます。ただし、実際のRAW画像ノイズは多くのノイズ源によ

reconstruction

arXiv reaDer

synthesis

arXiv

dataset

denoising
リンク
MixACM：アクティブ化されたチャネルマップの蒸留によるミックスアップベースのロバストネス転送
arxiv_reader 2021/11/10
ディープニューラルネットワークは、自然入力の敵対的に細工された、小さくて知覚できない変化の影響を受けやすくなっています。これらの例に対する最も効果的な防御メカニズムは、損失の反復最大化によってトレーニ

distillation

adversarial

arXiv reaDer

arXiv

learning

augmentation

dataset
リンク
高齢者の軽度認知障害の自動検出のための深い畳み込みネットワークベースの感情分析
arxiv_reader 2021/11/10
かなりの数の人々が世界中で認知障害に苦しんでいます。認知障害の早期発見は、患者と介護者の両方にとって非常に重要です。しかし、既存のアプローチには、診療所やニューロイメージング段階に伴う時間の消費や経済

SVM

convolutional

detection

video

arXiv reaDer

emotion

arXiv

face

dataset
リンク
群衆の中の鳥化を見る：知覚された動きからの地面の位置特定
arxiv_reader 2021/11/10
ビューバーディフィケーション、つまり群集内を移動する観測者（人や車両など）からキャプチャされたエゴ中心のビデオから、群集内の人の地面の動きを回復する問題を紹介します。回復した地面の動きは、状況を理解す

reconstruction

arXiv

trajectory

pedestrian

arXiv reaDer

synthesis

computer vision

Bayesian

localization

dataset
リンク
MMD-ReID：目に見える熱の人のReIDのためのシンプルだが効果的なソリューション
arxiv_reader 2021/11/10
モダリティ不変機能の学習は、クエリ画像とギャラリー画像が異なるモダリティから取得されるVisible-ThermalクロスモーダルPerson Reidentification（VT-ReID）の問題

person

adversarial

arXiv reaDer

domain

arXiv

learning

re-id

dataset
リンク
Eformer：医用画像のノイズ除去のためのエッジエンハンスメントベースのトランスフォーマー
arxiv_reader 2021/11/10
この作業では、Eformer-エッジエンハンスメントベースのトランスフォーマーを紹介します。これは、医用画像のノイズ除去にトランスフォーマーブロックを使用してエンコーダー-デコーダーネットワークを構築

CT

transformer

arXiv reaDer

arXiv

learning

dataset

residual

denoising
リンク
MAC-ReconNet：動的重み予測を使用したMR画像再構成のための複数取得コンテキストベースの畳み込みニューラルネットワーク
arxiv_reader 2021/11/10
畳み込みニューラルネットワークベースのMR再構成法は、高速で高品質の再構成を提供することが示されています。 CNNベースのモデルの主な欠点は、柔軟性に欠け、特定の取得コンテキストでのみ効果的に動作でき

reconstruction

MRI

arXiv

arXiv reaDer

CNN

dataset
リンク
マルチラベルリモートセンシング画像検索のための有益で代表的なトリプレット選択
arxiv_reader 2021/11/10
リモートセンシング（RS）画像間の類似性を学習することは、コンテンツベースのRS画像検索（CBIR）の基盤を形成します。最近、画像の意味的類似性を埋め込み（距離）空間にマッピングする深い距離学習アプロ

embedding

benchmark

DNN

metric learning

arXiv reaDer

arXiv
リンク
GDCA：デュアルディスクリミネーターとチャネルアテンションを備えたGANベースの単一画像超解像
arxiv_reader 2021/11/10
シングルイメージ超解像（SISR）は、非常に活発な研究分野です。このホワイトペーパーでは、デュアルディスクリミネーターを使用したGANベースのアプローチを使用し、注意メカニズムを組み込んで、SISRに

attention

super-resolution

arXiv reaDer

arXiv
リンク
少数ショット画像認識のためのエピソードリプレイ蒸留によるインクリメンタルメタ学習
arxiv_reader 2021/11/10
ほとんどのメタ学習アプローチは、基本知識のエピソード的なメタ学習に利用できるラベル付きデータの非常に大きなセットの存在を前提としています。これは、データが互いに素なクラスを含むタスクの形で段階的に到着

knowledge distillation

few-shot

one-shot

arXiv reaDer

arXiv

learning

dataset
リンク
時空間相補モデルによるビデオテキスト追跡
Video Text Tracking With a Spatio-Temporal Complementary Model テキスト追跡とは、ビデオ内の複数のテキストを追跡し、各テキストの軌跡を作成することです。既存の方法は、検出による追跡フレームワークを利用することによって、このタスクを積み重ねます。つまり、各フレームのテキストインスタンスを検出し、連続するフレームの対応するテキストインスタンスを関連付けます。このパラダイムの追跡精度は、より複雑なシナリオでは厳しく制限されていると主張します。たとえば、モーションブラーなどが原因で、テキストインスタンスの検出を見逃すと、テキストの軌跡が途切れます。さらに、外観が似ているさまざまなテキストインスタンスは簡単に混乱し、テキストインスタンスの関連付けが正しくなくなります。この目的のために、新しい時空間補完テキスト追跡モデルがこの論文で提案され
arxiv_reader 2021/11/10
テキスト追跡とは、ビデオ内の複数のテキストを追跡し、各テキストの軌跡を作成することです。既存の方法は、検出による追跡フレームワークを利用することによって、このタスクを積み重ねます。つまり、各フレームの

tracking

detection

video

benchmark

trajectory

spatio-temporal

arXiv reaDer

representation

arXiv

learning
リンク
FDG-PET画像によるアルツハイマー病の早期発見のための双線形プーリングおよびメトリック学習ネットワーク
arxiv_reader 2021/11/10
FDG-PETは、軽度認知障害（MCI）およびアルツハイマー病（AD）の患者の脳代謝の変化を明らかにします。コンピューター支援診断（CAD）テクノロジーによってFDG-PETから派生したいくつかのバイ

embedding

classification

metric learning

arXiv reaDer

representation

pooling

arXiv

identification

landmark
リンク
数ショットのセマンティックセグメンテーションのためのデュアルプロトタイプ対照学習
arxiv_reader 2021/11/10
いくつかの注釈付きサンプルを使用してターゲット画像内の新しいクラスオブジェクトをセグメント化することを目的とした、少数ショットセマンティックセグメンテーション（FSS）の問題に対処します。プロトタイプ

contrastive learning

semantic segmentation

few-shot

metric learning

arXiv reaDer

representation

arXiv

dataset
リンク
GAN圧縮における弁別器の再検討：生成器-弁別器協調圧縮スキーム
arxiv_reader 2021/11/10
最近、GAN圧縮の一連のアルゴリズムが検討されました。これは、リソースに制約のあるエッジデバイスにGANを展開する際に、計算のオーバーヘッドとメモリ使用量を大幅に削減することを目的としています。ただし

GAN

convolutional

distillation

adversarial

edge device

arXiv reaDer

arXiv

compression

pruning
リンク
言語とビジョンを備えたクロスモーダルタスクのためのTransformerアーキテクチャの展望と展望
arxiv_reader 2021/11/10
トランスフォーマーアーキテクチャは、長年にわたってリカレントニューラルネットワークによって支配されてきた計算言語学の分野に根本的な変化をもたらしました。その成功はまた、言語と視覚によるクロスモーダルタ

arXiv reaDer

RNN

transformer

arXiv
リンク
ビデオオブジェクトセグメンテーションのためのピクセルレベルの全単射マッチング
arxiv_reader 2021/11/10
半教師ありビデオオブジェクトセグメンテーション（VOS）は、ビデオの最初のフレームに存在する指定されたオブジェクトをピクセルレベルで追跡することを目的としています。オブジェクトの外観情報を十分に活用す

embedding

video

semi-supervised

arXiv reaDer

arXiv

segmentation
リンク
野生のドライバーの目線分類：ドメインと主題にわたる一般化に向けて
arxiv_reader 2021/11/10
脇見運転は危険な運転手です。先進運転支援システム（ADAS）にドライバーの注意散漫を検出する機能を装備すると、事故を防ぎ、ドライバーの安全性を向上させることができます。ドライバーの注意散漫を検出するた

reconstruction

classification

vehicle

attention

arXiv reaDer

representation

domain

arXiv

face

weakly-supervised
リンク
局所的な視覚的敵対的摂動に基づく可逆的攻撃
arxiv_reader 2021/11/10
ディープラーニングは、自動運転や顔認識などの多くのタスクでますます優れたパフォーマンスを発揮しており、さまざまな種類の攻撃にも挑戦しています。画像に人間の視覚に知覚できない摂動を追加すると、ニューラル

embedding

autonomous driving

adversarial

arXiv reaDer

human

arXiv

learning

compression

face recognition

dataset
リンク
Moblieデバイスでのモデル加速のためのジョイントチャネルとウェイトプルーニング
arxiv_reader 2021/11/10
モバイルデバイスでの実用的なディープニューラルネットワークの設計では、さまざまなアプリケーションで計算リソースと推論の待ち時間によって発生する制約を考慮することが不可欠です。ディープネットワークアクセ

classification

arXiv reaDer

arXiv

compression

pruning

dataset
リンク
グラフスペクトルクラスタリングを使用したイベントベースのビジョンのための移動物体検出
arxiv_reader 2021/11/10
移動物体検出は、自動運転車、ビデオ監視、セキュリティ、施行などの幅広いアプリケーションで、コンピュータビジョンの中心的な話題となっています。ニューロモルフィックビジョンセンサー（NVS）は、人間の目の

detection

video

clustering

pose

arXiv reaDer

human

computer vision

arXiv

unsupervised

dataset
リンク
半教師あり3D左心房セグメンテーションのためのパラメータデカップリング戦略
arxiv_reader 2021/11/10
一貫性トレーニングは、高度な半教師ありフレームワークであることが証明されており、入力のさまざまなビューに対して予測の不変性を適用することにより、医療画像セグメンテーションタスクで有望な結果を達成しまし

3D

regularization

semi-supervised

arXiv reaDer

arXiv

segmentation

dataset
リンク
点群強化のためのグラフベースの深度ノイズ除去と量子化解除
arxiv_reader 2021/11/10
3D点群は通常、1つまたは複数の視点でセンサーによって取得された深度測定値から構築されます。測定には、量子化とノイズの破損の両方があります。品質を向上させるために、以前の作品では、不完全な深度データを

3D

denoising

metric

point cloud

differentiable

arXiv reaDer

synthesis

arXiv

quantization

sparse
リンク
あなたの場所はどこですか、視覚的な場所の認識？
arxiv_reader 2021/11/10
視覚的場所認識（VPR）は、外観と視点が大幅に変更されたにもかかわらず、同じ場所を認識できることを特徴とすることがよくあります。 VPRは、空間人工知能の重要なコンポーネントであり、ロボットプラットフ

attention

arXiv reaDer

representation

computer vision

robot

arXiv

augmentation
リンク
PREMA：3D形状検索のためのパーツベースの反復マルチビュー集約ネットワーク
arxiv_reader 2021/11/10
不十分なビュー数、オクルージョン、背景の乱雑さなどの実際のビューの欠陥の悪影響を排除し、形状表現の識別能力を強化するために、パーツベースの反復マルチビュー集約ネットワーク（PREMA）を提案します。人

3D

occlusion

attention

arXiv reaDer

representation

human

arXiv

recurrent
リンク
SAFA：構造を意識した顔のアニメーション
生成的敵対的ネットワーク（GAN）の最近の成功は、顔のアニメーションタスクで大きな進歩を遂げました。ただし、顔画像の複雑なシーン構造では、ソース画像から大幅に逸脱した顔ポーズのビデオを生成することが依然として困難です。一方では、顔の幾何学的構造を知らないと、生成された顔画像が不適切に歪む可能性があります。一方、生成された画像の一部の領域がソース画像で遮られている可能性があり、GANがリアルな外観を生成するのが困難になります。これらの問題に対処するために、顔画像のさまざまなコンポーネントをモデル化するために特定の幾何学的構造を構築する構造認識顔アニメーション（SAFA）メソッドを提案します。よく知られているモーションベースの顔アニメーション手法に従って、3Dモーフィング可能モデル（3DMM）を使用して顔をモデル化し、複数のアフィン変換を使用して髪やあごひげなどの他の前景コンポーネントをモデル
arxiv_reader 2021/11/10
生成的敵対的ネットワーク（GAN）の最近の成功は、顔のアニメーションタスクで大きな進歩を遂げました。ただし、顔画像の複雑なシーン構造では、ソース画像から大幅に逸脱した顔ポーズのビデオを生成することが依

3D

GAN

embedding

video

pose

arXiv reaDer

arXiv

face
リンク
TransformationEquivariant解釈を使用した自己解釈可能なモデル
arxiv_reader 2021/11/10
本論文では、変換同変解釈を用いた自己解釈可能なモデルSITEを提案する。幾何学的変換の解釈の堅牢性と自己一貫性に焦点を当てています。変換の同変性とは別に、自己解釈可能なモデルとして、SITEは、ベンチ

benchmark

arXiv

interpretation

arXiv reaDer

approximation

computer vision

domain

CNN
リンク
CAPE：連続的な拡張位置埋め込みによる相対位置のエンコード
arxiv_reader 2021/11/10
位置情報がない場合、注意ベースのTransformerニューラルネットワークは順列不変です。絶対的または相対的な位置の埋め込みは、Transformerモデルに位置情報を提供するための最も一般的な方法

embedding

transformer

arXiv reaDer

arXiv

augmentation
リンク
ディープニューラルネットワークを使用した心臓興奮波のローター位置特定と位相マッピング
arxiv_reader 2021/11/10
心筋組織の電気インパルス現象の分析は、心調律障害やその他の心臓の病態生理学の診断に重要です。心臓マッピング技術は、局所的な時間測定値を取得し、それらを組み合わせて、心臓表面全体の電気生理学的波動現象の

spatio-temporal

video

arXiv reaDer

activity

learning

sparse

arXiv

localization

CNN
リンク
注意とマルチスケール機能融合を使用した手術器具のリアルタイムインスタンスセグメンテーション
arxiv_reader 2021/11/10
正確な機器セグメンテーションは、外科医が体をより簡単にナビゲートし、患者の安全性を高めるのに役立ちます。リアルタイムでの手術器具の正確な追跡は、低侵襲のコンピューター支援手術において重要な役割を果たし

real time

tracking

convolutional

metric

attention

arXiv reaDer

arXiv

augmentation

segmentation
リンク
多次元空間位置符号化のための学習可能なフーリエ特徴
arxiv_reader 2021/11/10
注意メカニズムは順序不変です。位置エンコーディングは、Transformerなどの注意ベースのディープモデルアーキテクチャが、情報の位置が重要なシーケンスや画像に対応できるようにするための重要なコンポ

transformer

benchmark

arXiv reaDer

representation

arXiv
リンク
深部地域競争による教師なし前景抽出
arxiv_reader 2021/11/10
完全に教師なしの方法で画像から前景オブジェクトを抽出するように設計されたアルゴリズムであるDeepRegion Competition（DRC）を紹介します。前景の抽出は、背景からオブジェクトを識別し

generative

bias

arXiv reaDer

disentangling

arXiv

unsupervised

segmentation
リンク
ロングテール分類のためのラベル認識分布キャリブレーション
arxiv_reader 2021/11/10
実世界のデータは通常、ロングテール分布を示します。不均衡なデータのトレーニングは、ニューラルネットワークをヘッドクラスでうまく機能させる傾向がありますが、テールクラスでははるかに悪くなります。テールク

estimation

classification

arXiv reaDer

synthesis

arXiv

dataset
リンク
LightFuse：軽量CNNベースのデュアル露出融合
arxiv_reader 2021/11/10
ディープ畳み込みニューラルネットワーク（DCNN）支援のハイダイナミックレンジ（HDR）イメージングは、最近多くの注目を集めました。 DCNNで生成されたHDR画像の品質は、従来の画像を上回っています

attention

arXiv reaDer

CNN

arXiv
リンク
教師なしドメイン適応によるAIベースの結核スクリーニングにおけるドメインシフトの緩和
arxiv_reader 2021/11/10
ドメイン不変特徴学習（DIFL）が、深層学習結核スクリーニングアルゴリズムのドメイン外の一般化可能性を改善できることを示します。最先端の深層学習アルゴリズムでは、「ドメインシフト」が原因で、目に見えな

domain adaptation

bias

arXiv reaDer

arXiv

learning

unsupervised

dataset
リンク
ニューラルネットワークアンサンブルを使用したCTスキャンでのユニバーサル病変検出
arxiv_reader 2021/11/10
臨床診療では、放射線科医は転移性病変と非転移性病変を区別する際に病変のサイズに依存しています。病変のサイジングの前提条件は、腫瘍の広がりの下流の評価を促進するため、それらの検出です。ただし、CTスキャ

detection

CT

arXiv reaDer

arXiv

localization

dataset
リンク
トランスフォーマーを使用したT2MRIでのリンパ節検出
arxiv_reader 2021/11/10
T2磁気共鳴画像法（MRI）でのリンパ節（LN）の識別は、リンパ増殖性疾患の評価中に放射線科医によって実行される重要なステップです。ノードのサイズはステージングにおいて重要な役割を果たし、放射線科医は

detection

MRI

transformer

arXiv reaDer

arXiv

identification

localization
リンク
機械学習と物理学の組み合わせ：複数のダークソリトンを追跡およびソートするためのフレームワーク
Combining Machine Learning with Physics: A Framework for Tracking and Sorting Multiple Dark Solitons 極低温原子実験では、データは多くの場合、システムの準備と測定に使用される手法に固有の情報損失を被る画像の形式で提供されます。これは、ボーズ・アインシュタイン凝縮（BEC）の励起間の相互作用など、対象のプロセスが複雑な場合に特に問題になります。このホワイトペーパーでは、機械学習（ML）モデルと物理ベースの従来の分析を組み合わせて、BECの画像内の複数の孤立性励起を識別および追跡するフレームワークについて説明します。 MLベースのオブジェクト検出器を使用して、孤立性励起を特定し、物理情報に基づいた分類器を開発して、孤立性励起を物理的に動機付けられたサブカテゴリに分類します。最後に、特定の機能がキ
arxiv_reader 2021/11/10
極低温原子実験では、データは多くの場合、システムの準備と測定に使用される手法に固有の情報損失を被る画像の形式で提供されます。これは、ボーズ・アインシュタイン凝縮（BEC）の励起間の相互作用など、対象の

tracking

detection

metric

arXiv reaDer

python

arXiv

learning

identification

dataset
リンク
LiMoSeg：リアルタイムの鳥瞰図ベースのLiDARモーションセグメンテーション
arxiv_reader 2021/11/10
移動物体の検出とセグメンテーションは、自動運転パイプラインの重要なタスクです。車両周辺の静的コンポーネントと移動コンポーネントを検出して分離することは、経路計画とローカリゼーションタスクで特に重要です

real time

detection

LiDAR

autonomous driving

classification

arXiv reaDer

arXiv

augmentation

segmentation
リンク
自然言語を使用した顔のプレゼンテーション攻撃の検出の説明
arxiv_reader 2021/11/10
顔面提示攻撃検出（PAD）の困難な問題に対処するために、多数のディープニューラルネットワークベースの手法が開発されています。そのような手法の焦点は、分類の精度と目に見えない攻撃や環境条件に対する堅牢性

detection

LSTM

loss function

classification

attention

arXiv reaDer

representation

arXiv

reasoning

dataset
リンク
ディープラーニングと拡張現実を統合して、消防環境における状況認識を強化する
arxiv_reader 2021/11/10
消防士の状況認識を文献で初めて構築するための新しい4つのアプローチを紹介します。安全性、効率性を高め、緊急時のファーストレスポンダー設定で消防士が実施する救助任務を正常に完了するために、相互に構築され

real time

tracking

arXiv

arXiv reaDer

CNN

R-CNN

augmentation

segmentation

anomaly detection
リンク
マルチオブジェクト医療画像セグメンテーションのための意味認識対照学習
arxiv_reader 2021/11/10
医療画像のセグメンテーション、つまりボクセルごとのセマンティックマスクの計算は、ボクセルレベルのセマンティックマスクを計算するための基本的でありながら困難なタスクです。大規模な臨床コホート全体でこのタ

contrastive learning

embedding

semantic segmentation

pose

attention

arXiv reaDer

arXiv

dataset
リンク
ハイブリッドBYOL-ViT：小さなデータセットを処理するための効率的なアプローチ
arxiv_reader 2021/11/10
教師あり学習は、難しい学習タスクを処理するために重要な大きな表現空間を学習できます。ただし、モデルの設計により、従来の画像分類アプローチでは、小さなデータセットを処理するときに、新しい問題や新しい状況

transformer

classification

self-supervised

arXiv reaDer

arXiv

learning

augmentation

dataset
リンク
歩行者と車両の安全性を向上させるための説明可能な自動化された都市介入
arxiv_reader 2021/11/10
現在、都市のモビリティ研究と政府のイニシアチブは、主に自動車関連の問題、たとえば渋滞や汚染の問題に焦点を合わせています。それでも、都市景観の中で最も脆弱な要素である歩行者を無視することはできません。歩

explainable

arXiv

vehicle

pedestrian

arXiv reaDer

computer vision

CNN

segmentation

residual
リンク
U-Netベースのモデルを使用した深海要素の予測
arxiv_reader 2021/11/10
エネルギーの需給は気象条件の影響を受けます。再生可能エネルギー源の需要が増えるにつれて、正確な天気予報の関連性が高まります。エネルギープロバイダーと政策立案者は、情報に基づいた選択を行い、運用目標に従

convolutional

U-Net

arXiv reaDer

satellite

arXiv

learning

residual
リンク
生成された3Dオブジェクトの進化する刺激的な2Dビュー
ImageNetおよびCLIPベースのモデルによって導かれるプロセスを使用して、オブジェクトの3Dモデルと異なる表示角度での2Dレンダリングを共同で生成する方法を紹介します。私たちの結果は、ターゲットのキャプションを呼び起こし、視覚的に魅力的に見えるレンダリングで、アナモルフィックオブジェクトを生成できることを示しています。 We present a method for jointly generating 3D models of objects and 2D renders at different viewing angles, with the process guided by ImageNet and CLIP -based models. Our results indicate that it can generate anamorphic objects, with r
arxiv_reader 2021/11/10
ImageNetおよびCLIPベースのモデルによって導かれるプロセスを使用して、オブジェクトの3Dモデルと異なる表示角度での2Dレンダリングを共同で生成する方法を紹介します。私たちの結果は、ターゲット

3D

arXiv reaDer

arXiv
リンク
ビデオからのカスケードされた多言語オーディオビジュアル学習
この論文では、教育ビデオから学ぶ自己監視型視聴覚モデルを探求します。以前の研究では、これらのモデルは、ビデオの大規模なデータセットでトレーニングした後、話し言葉や音を視覚的なコンテンツに関連付けることができることが示されていますが、英語のビデオでのみトレーニングおよび評価されました。多言語の視聴覚表現を学習するために、英語のビデオでトレーニングされたモデルを活用し、それを日本語のビデオなどの他の言語の視聴覚データに適用するカスケードアプローチを提案します。カスケードアプローチを使用すると、日本のビデオのみのトレーニングと比較して、検索パフォーマンスが約10倍向上することがわかります。また、英語のビデオでトレーニングされたモデルを日本語とヒンディー語の画像のキャプションに適用し、最先端のパフォーマンスを実現します。 In this paper, we explore self-supervi
arxiv_reader 2021/11/10
この論文では、教育ビデオから学ぶ自己監視型視聴覚モデルを探求します。以前の研究では、これらのモデルは、ビデオの大規模なデータセットでトレーニングした後、話し言葉や音を視覚的なコンテンツに関連付けること

video

self-supervised

arXiv reaDer

representation

arXiv

learning

dataset
リンク
自己監視型および少数ショットの物体検出の調査
arxiv_reader 2021/11/10
データのラベリングは、特にオブジェクト検出やインスタンスのセグメンテーションなど、画像の高密度のラベリングを必要とするタスクの場合、多くの場合、費用と時間がかかります。数ショットのオブジェクト検出は、

detection

few-shot

self-supervised

arXiv reaDer

representation

arXiv

learning

segmentation
リンク
分布外のダーモスコピー病変検出のための教師なしアプローチ
arxiv_reader 2021/11/10
複雑な医療データに対する教師なし分布外（OOD）法の有効性を示す限られた研究があります。ここでは、教師なしOOD検出アルゴリズムであるSimCLR-LOFの予備的な調査結果と、医用画像に適用された最新

detection

OOD

arXiv reaDer

arXiv

unsupervised

dataset
リンク
TAGLETS：補助データを使用した自動半教師あり学習のためのシステム
arxiv_reader 2021/11/10
機械学習の実践者は、多くの場合、さまざまなデータにアクセスできます。ターゲットタスクのラベル付きデータ（多くの場合制限されています）、ラベルなしデータ、補助データ、他のタスクで利用可能な多くのラベル付

distillation

classification

semi-supervised

transfer learning

arXiv reaDer

arXiv

dataset
リンク
マルチモーダル教師なし欺瞞検出のための影響認識ディープビリーフネットワーク表現
arxiv_reader 2021/11/10
欺瞞の社会的行動を検出する自動化されたシステムは、医療、ソーシャルワーク、および法的領域全体で人間の幸福を高めることができます。監視ありの欺瞞検出モデルをトレーニングするためのラベル付きデータセットは

detection

clustering

classification

arXiv reaDer

representation

human

domain

arXiv

unsupervised

dataset
リンク
正式な論理に基づく視覚的な質問応答
arxiv_reader 2021/11/10
視覚的質問応答（VQA）は、複数のモダリティ（つまり、画像、言語）からの情報を理解する際に課せられる課題のために、近年、機械学習コミュニティで大きな注目を集めています。 VQAでは、一連の画像に基づい

transformer

arXiv reaDer

representation

human

learning

arXiv

VQA

reasoning

dataset
リンク
錐台フュージョン：3D検出用の疑似LiDARおよびLiDARフュージョン
arxiv_reader 2021/11/10
ほとんどの自動運転車には、LiDARセンサーとステレオカメラが搭載されています。前者は非常に正確ですが、スパースデータを生成しますが、後者は密度が高く、テクスチャと色の情報が豊富ですが、堅牢な3D表現

3D

detection

LiDAR

point cloud

stereo

vehicle

arXiv reaDer

representation

arXiv

sparse
リンク
前庭神経鞘腫および蝸牛セグメンテーションのためのクロスモダリティドメイン適応
arxiv_reader 2021/11/10
前庭神経鞘腫（VS）腫瘍と蝸牛を磁気共鳴画像法（MRI）からセグメント化する自動方法は、VS治療計画にとって重要です。教師あり手法はVSセグメンテーションで満足のいくパフォーマンスを達成しましたが、専

MRI

domain adaptation

semi-supervised

arXiv reaDer

arXiv

unsupervised

segmentation

weakly-supervised
リンク
ディープラーニングを使用した胚分極の無染色検出
arxiv_reader 2021/11/10
適切な発生時期での哺乳類の胚の分極化は、その発生期間を延ばすために重要であり、ヒト胚の可能性を評価する上で価値があります。ただし、偏光の追跡には、体外受精クリニックでは許可されていない侵襲的な蛍光染色

tracking

detection

arXiv reaDer

human

arXiv

learning

dataset
リンク
E（2）電波天文学のための同変自己注意
arxiv_reader 2021/11/10
この作品では、天文学における説明可能な電波銀河分類の問題に対処するために、グループ同変自己注意モデルを紹介します。周期的および二面角の両方の等分散のさまざまな次数を評価し、前もって等分散を含めると、デ

explainable

classification

arXiv reaDer

human

arXiv
リンク
BRACS：H＆E組織像におけるBReAst癌サブタイピングのデータセット
arxiv_reader 2021/11/10
乳がんは最も一般的に診断されるがんであり、がんの女性の死亡数が最も多いです。大規模なスクリーニング方針と組み合わされた診断活動の最近の進歩は、乳がん患者の死亡率を大幅に低下させました。ただし、病理学者

pose

arXiv reaDer

activity

arXiv

learning

dataset
リンク
DR-VNet：高密度残余UNetによる網膜血管セグメンテーション
arxiv_reader 2021/11/10
正確な網膜血管セグメンテーションは、多くのコンピュータ支援診断システムにとって重要なタスクです。それでも、目の血管構造が複雑であるため、それは依然として困難な問題です。最近、多くの血管セグメンテーショ

metric

arXiv reaDer

arXiv

learning

segmentation

residual

dataset
リンク
HEROHEチャレンジ：免疫組織化学またはinsituハイブリダイゼーションを行わずに乳がんのHER2状態を評価する
arxiv_reader 2021/11/10
乳がんは女性に最もよく見られる悪性腫瘍であり、毎年50万人以上が死亡しています。そのため、早期かつ正確な診断が最も重要です。乳がんを診断して正しく分類し、適切な治療法を定義するには、人間の専門知識が必

classification

bias

arXiv reaDer

human

arXiv
リンク
ドメイン適応のための合成磁気共鳴画像：胎児の脳組織セグメンテーションへの応用
Synthetic magnetic resonance images for domain adaptation: Application to fetal brain tissue segmentation 子宮内で発達している人間の脳の定量的評価は、神経発達を完全に理解するために重要です。したがって、自動化された多組織胎児脳セグメンテーションアルゴリズムが開発されており、これには注釈付きデータのトレーニングが必要です。ただし、利用可能な注釈付き胎児脳データセットは、数と不均一性が制限されており、堅牢なセグメンテーションのためのドメイン適応戦略を妨げています。このコンテキストでは、胎児の脳の磁気共鳴取得数値ファントムであるFaBiANを使用して、胎児の脳のさまざまな現実的な磁気共鳴画像とそのクラスラベルをシミュレートします。これらの複数の合成注釈付きデータは、無料で生成され、ターゲット
arxiv_reader 2021/11/10
子宮内で発達している人間の脳の定量的評価は、神経発達を完全に理解するために重要です。したがって、自動化された多組織胎児脳セグメンテーションアルゴリズムが開発されており、これには注釈付きデータのトレーニ

domain adaptation

arXiv reaDer

synthesis

human

arXiv

learning

super-resolution

segmentation

dataset
リンク
ディープラーニングによるマルチモダリティ心臓画像分析
arxiv_reader 2021/11/10
マルチモダリティ画像からの正確な心臓コンピューティング、分析、モデリングは、心臓病の診断と治療にとって重要です。後期ガドリニウム造影磁気共鳴画像法（LGE MRI）は、心筋梗塞（MI）と心房瘢痕を視覚

MRI

benchmark

domain adaptation

arXiv reaDer

arXiv

learning

unsupervised

segmentation
リンク
MRモダリティが欠落している脳腫瘍セグメンテーションのための機能強化生成およびマルチモダリティ融合ベースの深部神経ネットワーク
arxiv_reader 2021/11/10
正確な脳腫瘍のセグメンテーションには、マルチモーダル磁気共鳴画像法（MRI）の使用が必要です。主な問題は、すべてのタイプのMRIが臨床検査で常に利用できるわけではないということです。同じ患者のMRモダ

3D

MRI

U-Net

arXiv reaDer

arXiv

segmentation

dataset
リンク
ノイズの多いラベルを使用した顕微鏡画像における多発性骨髄腫形質細胞のセグメンテーション
arxiv_reader 2021/11/10
改善された迅速な癌診断に向けた重要な要素は、コンピューター支援ツールの開発です。この記事では、顕微鏡画像での多発性骨髄腫形質細胞のセグメンテーションに関するSegPC-2021コンペティションで優勝し

arXiv reaDer

arXiv

augmentation

segmentation

dataset
リンク
医療画像セグメンテーション用の混合変圧器U-Net
arxiv_reader 2021/11/10
U-Netは、医療画像のセグメンテーションタスクで大きな成功を収めていますが、長距離の依存関係を明示的にモデル化する機能がありません。したがって、Vision Transformerは、Self-At

transformer

U-Net

pre-training

attention

arXiv reaDer

arXiv

learning

segmentation

dataset
リンク
形状認識関係ネットワークを介した正確な内視鏡的粘膜下層剥離術のためのリアルタイムのランドマーク検出
arxiv_reader 2021/11/10
内視鏡的粘膜下層剥離術（ESD）手術における正確でリアルタイムのランドマーク検出のための新しい形状認識関係ネットワークを提案します。このタスクは臨床的に非常に重要ですが、複雑な手術環境での出血、照明の

real time

detection

adversarial

regularization

arXiv reaDer

keypoint

arXiv

landmark

multi-task

dataset
リンク
限定ビュー光音響コンピュータ断層撮影のための深層学習適応加速
arxiv_reader 2021/11/10
光音響イメージング（PAI）は、光励起で組織から生成された超音波信号を検出する非侵襲的イメージングモダリティです。光音響コンピュータ断層撮影（PACT）は、焦点の合っていない大面積光を使用して、PA信

reconstruction

detection

regularization

gradient

arXiv reaDer

arXiv

learning

simulation
リンク
逆問題の深層学習法の調査
arxiv_reader 2021/11/10
この論文では、逆問題を解くためのさまざまな深層学習戦略を調査します。逆問題の既存の深層学習ソリューションを、直接マッピング、データ整合性オプティマイザー、および深正則化の3つのカテゴリに分類します。

3D

tracking

classification

arXiv reaDer

human

computer vision

domain

arXiv

face

denoising
リンク
EEGEyeNet：脳波と視線追跡の同時データセットと眼球運動予測のベンチマーク
arxiv_reader 2021/11/10
脳活動と眼球運動の交差点での研究を進めることを目的として、新しいデータセットとベンチマークを提示します。私たちのデータセットEEGEyeNetは、3つの異なる実験パラダイムから収集された356の異なる

benchmark

arXiv reaDer

activity

arXiv

learning

gaze

dataset
リンク
事前に訓練された顔認識の学習された表現の情報理論的バイアス評価
arxiv_reader 2021/11/10
最近、顔認識の使用における平等の問題が多くの注目を集めているため、マイノリティへの公平性を向上させるために、偏りのない深層学習モデルに大きな努力が払われています。ただし、バイアス評価指標の明確な定義や

classification

arXiv reaDer

benchmark

attention

arXiv

metric

dataset

representation

synthesis

face recognition
リンク
インターモダリティのプロービング：視覚言語の事前トレーニングのための自己注意による視覚解析
arxiv_reader 2021/11/10
Vision-Language Pre-training（VLP）は、画像とテキストのペアからマルチモーダル表現を学習することを目的としており、微調整して下流の視覚言語タスクに役立ちます。主要なVLP

pre-training

arXiv reaDer

embedding

CNN

arXiv

VQA

representation

transformer

reasoning

metric
リンク
RIFE：ビデオフレーム補間のためのリアルタイム中間フロー推定
arxiv_reader 2021/11/10
ビデオフレーム補間（VFI）用のリアルタイム中間フロー推定アルゴリズムであるRIFEを提案します。最近の多くのフローベースのVFIメソッドは、最初に双方向オプティカルフローを推定し、次にそれらをスケー

pre-training

arXiv reaDer

video

optical flow

benchmark

estimation

distillation

arXiv

real time
リンク
3Dモデル上の高密度の代表的な歯のランドマーク/軸検出ネットワーク
arxiv_reader 2021/11/10
人工知能（AI）テクノロジーは、デジタル歯列矯正にますます使用されていますが、課題の1つは、歯のランドマークと軸を自動的かつ正確に検出することです。これは、部分的にはそれらの洗練された幾何学的定義によ

arXiv reaDer

learning

detection

dataset

arXiv

sparse

3D

landmark
リンク
緑内障バイオマーカーとしての網膜中心静脈血管幹および枝の三次元構造構成
arxiv_reader 2021/11/10
目的：網膜中心静脈閉塞症とその枝（CRVT＆B）の3次元（3D）構造構成を緑内障の診断マーカーとして使用できるかどうかを評価すること。方法：視神経乳頭（ONH）の光コヒーレンストモグラフィー（OCT）

arXiv

3D

arXiv reaDer

segmentation

CNN

learning
リンク
次世代測定システムの信号処理に関するロードマップ
arxiv_reader 2021/11/10
信号処理は、ほとんどすべてのセンサー対応システムの基本的なコンポーネントであり、さまざまな科学分野にわたる幅広いアプリケーションがあります。時系列データ、画像、およびビデオシーケンスは、情報の抽出と定

video

arXiv

attention

arXiv reaDer

learning
リンク
Klarna製品ページデータセット：Web表現学習の現実的なベンチマーク
arxiv_reader 2021/11/10
このホワイトペーパーでは、DOMツリー要素表現学習の未踏の問題に取り組んでいます。私たちは機械学習ベースのWeb自動化の分野を前進させ、この重要な分野に関するさらなる研究を2つの貢献で促進したいと考え

embedding

representation learning

dataset

benchmark

computer vision

arXiv

arXiv reaDer

CNN

classification
リンク
- 2021年11月11日
- 2021年11月10日
- 2021年11月9日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx