arxiv_readerのブックマーク / 2021年9月3日 - はてなブックマーク

arxiv_reader id:arxiv_reader

2021年9月3日のブックマーク (92件)

衣服の人間をモデル化するためのポイントの力
arxiv_reader 2021/09/03
現在、アーティストは自然に動くことができるリアルな服を着て3Dの人間のアバターを作成する必要があります。人体の3Dスキャンとモデリングの進歩にもかかわらず、静的スキャンをアニメート可能なアバターに簡単

human

mesh

pose

3D

representation

arXiv reaDer

point cloud

person

arXiv
リンク
深い神経ネットワークの帰属のためのSmoothTaylorと統合された勾配の理解
arxiv_reader 2021/09/03
ディープニューラルネットワークモデルの帰属方法としての統合勾配は、単純な実装可能性を提供します。しかし、それは解釈のしやすさに影響を与える説明のうるささに悩まされています。 SmoothGrad手法は

dataset

saliency

arXiv reaDer

classification

arXiv
リンク
視覚言語モデルを促す学習
arxiv_reader 2021/09/03
視覚言語の事前トレーニングは、表現学習の有望な代替手段として最近浮上しています。これは、視覚的な概念として見られる固定された重みのセットを学習するために画像と個別のラベルを使用する従来の方法から、2つ

dataset

arXiv reaDer

domain

zero-shot

representation learning

arXiv

pre-training
リンク
時間的3D心エコー検査シーケンスにおける左心室の体積セグメンテーションのための新しい半自動アルゴリズム
arxiv_reader 2021/09/03
目的：心エコー検査は、心臓機能を評価するための臨床診療における非侵襲的イメージングツールとして一般的に使用されています。ただし、スペックルノイズの存在や信号対ノイズ比の低さなど、超音波イメージングの固

3D

arXiv reaDer

segmentation

arXiv
リンク
NerfingMVS：屋内マルチビューステレオの神経放射輝度フィールドのガイド付き最適化
arxiv_reader 2021/09/03
この作業では、最近提案された神経放射輝度フィールド（NeRF）に対して従来のSfM再構成と学習ベースの事前確率の両方を利用する新しいマルチビュー深度推定方法を提示します。推定された対応に依存する既存の

estimation

stereo

reconstruction

arXiv reaDer

synthesis

sparse

monocular

arXiv
リンク
スタイル転送によるドメインロバストな有糸分裂像の検出
arxiv_reader 2021/09/03
有糸分裂像検出におけるドメイン一般化のための新しいトレーニングスキームを提案します。さまざまなスキャナータイプによる画像の差異をさまざまな画像スタイルと見なすことにより、スキャナータイプで堅牢になるよ

arXiv reaDer

domain

arXiv

detection
リンク
インスタンスセグメンテーションモデルの堅牢性のベンチマーク
arxiv_reader 2021/09/03
このホワイトペーパーでは、実際の画像の破損やドメイン外の画像コレクション、たとえばモデルが学習したトレーニングデータセットとは異なる設定で収集されたデータセットに関して、インスタンスセグメンテーション

dataset

arXiv reaDer

benchmark

multi-task

segmentation

domain adaptation

arXiv
リンク
畳み込みニューラルネットワークベースの特徴を使用した葉の認識
arxiv_reader 2021/09/03
植物の生物多様性を保護するための協調的な取り組みを伴う、世界中の植物生息地の喪失に対する警告灯があります。したがって、植物種の分類は、この環境上の課題に対処するために非常に重要です。近年、植物分類学に

CNN

SVM

dataset

representation

arXiv reaDer

classification

arXiv
リンク
空間クロマシフトによる知覚できない敵対的な例
arxiv_reader 2021/09/03
ディープニューラルネットワークは、さまざまな種類の敵対的摂動に対して脆弱であることが示されています。広く研究されている加法性ノイズベースの摂動に加えて、入力画像にピクセルごとの空間ドリフトを適用するこ

human

metric

dataset

arXiv reaDer

adversarial

compression

learning

arXiv
リンク
機能的対応問題
arxiv_reader 2021/09/03
視覚データの対応を見つける機能は、ほとんどのコンピュータビジョンタスクの本質です。しかし、正しい対応は何ですか？視覚的対応のタスクは、同じオブジェクトインスタンスの2つの異なる画像に対して明確に定義さ

computer vision

few-shot

representation

arXiv reaDer

classification

learning

arXiv
リンク
オンターゲット適応
arxiv_reader 2021/09/03
ドメイン適応は、ソースドメインでのトレーニングとターゲットドメインでのテストの間のシフトを軽減しようとします。ほとんどの適応方法は、ソースデータとターゲットデータの共同最適化によるソースデータに依存し

representation

arXiv reaDer

classification

learning

domain adaptation

arXiv
リンク
MIDOGチャレンジのカスケードRCNN
arxiv_reader 2021/09/03
有糸分裂数は、乳がんの予後の重要な指標の1つです。しかし、正確な有糸分裂細胞のカウントは依然として困難な問題であり、骨の折れる作業です。このタスクには自動化された方法が提案されていますが、通常はトレー

arXiv reaDer

domain

detection

R-CNN

arXiv
リンク
画像分類タスクにおける畳み込みニューラルネットワークの説明のためのホワイトボックス法
arxiv_reader 2021/09/03
近年、複数のドメインからのアプリケーションを解決するためにディープラーニングが普及しています。畳み込みニューラルネットワーク（CNN）は、特に画像分類のタスクで最先端のパフォーマンスを実証しています。

CNN

human

arXiv reaDer

domain

reasoning

classification

learning

arXiv
リンク
胸部X線の疾患を意識した画像編集に向けて
arxiv_reader 2021/09/03
生成的敵対的ネットワーク（GAN）による病気を意識した画像編集は、ヘルスケアセクターでのAIの使用を促進するための有望な手段を構成します。ここでは、このアイデアの概念実証を提示します。 GANベースの

arXiv reaDer

domain

GAN

synthesis

arXiv
リンク
スライド：ソフトレイヤーと深さを意識したインペインティングを使用した単一画像の3D写真
arxiv_reader 2021/09/03
単一画像の3D写真により、視聴者は新しい視点から静止画像を見ることができます。最近のアプローチは、単眼深度ネットワークと修復ネットワークを組み合わせて、説得力のある結果を達成しています。これらの手法の

3D

dataset

arXiv reaDer

segmentation

monocular

arXiv
リンク
学習したマルチモーダルアライメントのための4D-Net
arxiv_reader 2021/09/03
3DポイントクラウドとRGBセンシング情報の両方を時間内に利用する3Dオブジェクト検出アプローチである4D-Netを紹介します。さまざまな特徴表現と抽象化レベルにわたって新しい動的接続学習を実行し、幾

3D

dataset

representation

arXiv reaDer

learning

detection

point cloud

arXiv
リンク
新しい広範なデータセットと混合機能に基づくショット境界検出方法
Shot boundary detection method based on a new extensive dataset and mixed features ビデオのショット境界検出は、ビデオデータ処理の重要な段階の1つです。色ヒストグラムやオブジェクト境界など、いくつかのビデオ機能に基づくショット境界検出の新しい方法が提案されています。開発されたアルゴリズムは、オープンなBBC Planet Earth [1]およびRAI [2]データセットでテストされ、MSUで実施されたビデオコーデックの比較で使用されたビデオとIBMセットのビデオに基づいて、MSUCCデータセットがテストされました。また、プロットされます。アルゴリズムの開発とテストの合計データセットは、既知のTRECVIDデータセットを超えました。テスト結果に基づいて、シーン変更検出のために提案されたアルゴリズムは、0.97
arxiv_reader 2021/09/03
ビデオのショット境界検出は、ビデオデータ処理の重要な段階の1つです。色ヒストグラムやオブジェクト境界など、いくつかのビデオ機能に基づくショット境界検出の新しい方法が提案されています。開発されたアルゴリ

dataset

arXiv reaDer

video

detection

arXiv
リンク
分類マージンを介してノイズの多いラベルと戦うことを学ぶ
arxiv_reader 2021/09/03
ノイズの多いラベルでトレーニングされた深いニューラルネットワークは、クリーンなインスタンスとノイズの多いインスタンスを区別する能力をすぐに失うことが知られています。初期の学習フェーズが終了した後、ネッ

dataset

arXiv reaDer

benchmark

synthesis

classification

learning

arXiv
リンク
PHDフィルターを備えた一連の軌道を使用した拡張オブジェクトトラッキング
arxiv_reader 2021/09/03
PHDフィルタリングは、オブジェクトの数とその状態が不明なシナリオで使用される、一般的で効果的な複数オブジェクト追跡（MOT）アルゴリズムです。各オブジェクトがスキャンごとに複数の測定値を生成できるシ

arXiv reaDer

MOT

arXiv
リンク
延期された時空間一貫性による動的シーンの新しいビューの合成
arxiv_reader 2021/09/03
運動からの構造（SfM）を使用すると、さまざまな視点のカメラからのカジュアルなキャプチャを介してシーンを再構築できます。また、新しいビュー合成（NVS）を使用すると、キャプチャしたシーンを新しい視点か

spatio-temporal

pose

dataset

arXiv reaDer

synthesis

point cloud

sparse

arXiv
リンク
動的タイムワーピングによる時系列の正確な形状と位相の平均化
arxiv_reader 2021/09/03
動的タイムワーピング（DTW）に基づく新しい時系列平均化法を提案します。以前の方法とは対照的に、私たちのアルゴリズムは、DTWの出力を時系列に単純に変換し、革新的な反復平均化プロセスを行うため、期間情

dataset

arXiv reaDer

synthesis

landmark

arXiv
リンク
異種畳み込みWGANによる赤外線画像の超解像
arxiv_reader 2021/09/03
画像の超解像は、監視やリモートセンシングなど、多くの分野で重要です。ただし、光学機器は比較的高価であるため、通常、赤外線（IR）画像の解像度は低くなります。最近、深層学習法が画像の超解像を支配し、可視

DNN

residual

super-resolution

convolutional

loss function

arXiv reaDer

adversarial

GAN

arXiv

attention
リンク
TrouSPI-Net：骨格横断歩道予測のための平行なアトラス畳み込みとU-GRUに関する時空間的注意
arxiv_reader 2021/09/03
歩行者の行動や意図を理解することは、歩行者の意図を正確に予測することで車両の安全性と快適な運転を保証できるため、車両の自律性にとって依然として主要な課題の1つです。この論文では、歩行者の骨格のダイナミ

vehicle

spatio-temporal

convolutional

pedestrian

arXiv reaDer

arXiv

attention
リンク
GAM：グラデーションアクティベーションマップによる説明可能な視覚的類似性と分類
arxiv_reader 2021/09/03
視覚的類似性と分類モデルによって行われた予測を説明するための機構であるGradientActivation Maps（GAM）を紹介します。 GAMは、複数のネットワークレイヤーからローカライズされた

dataset

gradient

arXiv reaDer

classification

arXiv

explainable
リンク
教師なしドメイン適応のための敵対的ロバスト性
広範な教師なしドメイン適応（UDA）研究は、深いモデルを使用して、ラベル付きのソースドメインとラベルなしのターゲットドメイン間で転送可能な表現を学習することにより、実際に大きな成功を収めています。ただし、これまでの作業では、実際のアプリケーションで重要な敵対的な堅牢性を考慮せずに、クリーンな例でのUDAモデルの一般化能力を向上させることに焦点を当てています。従来の敵対的トレーニング方法は、教師あり損失関数によって生成された敵対的例を使用してモデルをトレーニングするため、UDAのラベルなしターゲットドメインでの敵対的ロバスト性には適していません。この作業では、複数の堅牢なImageNetモデルによって学習された中間表現を活用して、UDAモデルの堅牢性を向上させます。私たちの方法は、UDAモデルの機能を、ドメイン適応トレーニングとともにImageNetの事前トレーニング済みモデルによって学習さ
arxiv_reader 2021/09/03
広範な教師なしドメイン適応（UDA）研究は、深いモデルを使用して、ラベル付きのソースドメインとラベルなしのターゲットドメイン間で転送可能な表現を学習することにより、実際に大きな成功を収めています。ただ

loss function

representation

arXiv reaDer

adversarial

benchmark

unsupervised

learning

domain adaptation

arXiv

pre-training
リンク
円充填解釈を使用したディープキーストロークバイオメトリクスに適用されるSetMargin損失
arxiv_reader 2021/09/03
この作品は、新しい距離メトリック学習法（DML）に基づくキーストロークバイオメトリクスの新しい深層学習アプローチを提示します。 DMLは、入力データを学習された表現空間にマッピングし、距離に基づいた「

identification

interpretation

biometrics

representation

arXiv reaDer

metric learning

arXiv
リンク
画像分類モデルの敵対的ロバスト性に対する注意の影響
Impact of Attention on Adversarial Robustness of Image Classification Models 深層学習モデルに対する敵対的攻撃は大きな注目を集めており、最近の研究では、これらの攻撃からモデルを防御するための敵対的例と手法の存在についての説明が提案されています。コンピュータビジョンへの注意は、重要な機能の集中的な学習を組み込むために使用されており、精度の向上につながっています。最近、敵対者のロバスト性を強化するために、注意メカニズムを備えたモデルが提案されています。このコンテキストに続いて、この作業は、敵対者の頑健性に対する注意の影響の一般的な理解を目的としています。この作品は、人気のあるホワイトボックスとブラックボックスの攻撃の下でCIFAR-10、CIFAR-100、FashionMNISTデータセットでトレーニングされた非注意
arxiv_reader 2021/09/03
深層学習モデルに対する敵対的攻撃は大きな注目を集めており、最近の研究では、これらの攻撃からモデルを防御するための敵対的例と手法の存在についての説明が提案されています。コンピュータビジョンへの注意は、重

computer vision

dataset

arXiv reaDer

adversarial

classification

learning

arXiv

attention
リンク
次のインタラクティブな指導のための知覚と方針の因数分解
arxiv_reader 2021/09/03
言語指令に基づいて簡単な家事を行うことは、人間にとって非常に自然なことですが、AIエージェントにとっては未解決の課題です。「次の対話型命令」タスクは、すべてのステップで環境内を共同でナビゲート、対話

arXiv reaDer

arXiv

benchmark

action
リンク
Opti-Enc：クロスドメインカラー化画像の熱画像カラー化のための最適なエンコーダ-デコーダへの道
arxiv_reader 2021/09/03
熱画像は、キャプチャされるオブジェクトの熱プロファイルに基づいて、グレースケール画像または疑似カラー画像のいずれかとして取得できます。この作業では、熱光学融合ドメイン画像を作成するための最適なエンコー

dataset

arXiv reaDer

domain

arXiv
リンク
FA-GAN：テキストから画像への合成のための特徴認識GAN
テキストから画像への合成は、特定の自然言語の説明から写実的な画像を生成することを目的としています。以前の作業は、Generative Adversarial Networks（GAN）で大きな進歩を遂げました。それでも、無傷のオブジェクトやクリアなテクスチャを生成することは依然として困難です（図1）。この問題に対処するために、機能認識生成的敵対的ネットワーク（FA-GAN）を提案し、自己監視型弁別器と機能認識損失の2つの手法を統合して高品質の画像を合成します。まず、補助デコーダーを備えた自己監視型ディスクリミネーターを設計して、ディスクリミネーターがより適切な表現を抽出できるようにします。次に、特徴認識損失を導入して、自己監視あり弁別器からの特徴表現を使用することにより、ジェネレーターにより直接的な監視を提供します。 MS-COCOデータセットでの実験は、提案された方法が最先端のFIDスコ
arxiv_reader 2021/09/03
テキストから画像への合成は、特定の自然言語の説明から写実的な画像を生成することを目的としています。以前の作業は、Generative Adversarial Networks（GAN）で大きな進歩を遂

dataset

representation

arXiv reaDer

GAN

synthesis

self-supervised

arXiv
リンク
医療画像セグメンテーションの確率とエラーに対する出力活性化関数の影響
arxiv_reader 2021/09/03
シグモイド活性化は、ニューラルネットワークを使用したバイナリ分類およびセグメンテーションにおける標準出力活性化関数です。それでも、医療画像のセグメンテーションの結果を改善する可能性のある、他のさまざま

loss function

arXiv reaDer

classification

segmentation

arXiv
リンク
系統的ノイズによる実世界のロバスト性
arxiv_reader 2021/09/03
偶然に決定されない系統的エラーは、多くの場合、システムに固有の不正確さ（観察または測定プロセスのいずれかを含む）を指します。この論文では、系統的エラーによって引き起こされた、長い間無視されていたが頻繁

dataset

arXiv reaDer

adversarial

benchmark

arXiv
リンク
マルチイルミネーション色覚恒常の生成モデル
arxiv_reader 2021/09/03
この論文では、目的はマルチイルミネーションの色覚恒常です。ただし、既存の色覚恒常法のほとんどは、単一の光源用に設計されています。さらに、複数の照明の色覚恒常性を学習するためのデータセットはほとんどあり

estimation

augmentation

generative

dataset

arXiv reaDer

domain

GAN

learning

arXiv
リンク
有糸分裂領域の一般化の課題に対する染色に強い有糸分裂像の検出
arxiv_reader 2021/09/03
さまざまなスキャナー/サイトからの有糸分裂像の検出は、臨床医の腫瘍の等級付けを支援する可能性があるため、依然として重要な研究トピックです。 MItosis DOmain Generalization（

arXiv reaDer

domain

detection

arXiv

learning
リンク
SlowFastRolling-自己中心的なビデオでの行動予測のためのLSTMの展開
arxiv_reader 2021/09/03
自己中心的なビデオでの行動予測は、人間の行動の本質的にマルチモーダルな性質のために困難な作業です。さらに、一部のアクションは、アクターまたは周囲のコンテキストに応じて、他のアクションよりも速くまたは遅

LSTM

human

action

metric

dataset

arXiv reaDer

video

optical flow

arXiv
リンク
FCCDN：VHR画像変化検出のための機能制約ネットワーク
arxiv_reader 2021/09/03
変化検出は、両耳側性半共登録画像のピクセルごとの違いを識別するプロセスです。それは地球観測にとって非常に重要です。最近、深層学習（DL）の出現により、変化検出の分野で深層畳み込みニューラルネットワーク

CNN

dataset

arXiv reaDer

detection

self-supervised

learning

semantic segmentation

arXiv
リンク
CTイメージングからのCOVID-19診断のための設計による説明可能な半教師あり表現学習
arxiv_reader 2021/09/03
私たちの動機付けとなるアプリケーションは、現実世界の問題です。CTイメージングからのCOVID-19分類では、効率的な特徴の埋め込みを抽出するために変分オートエンコーダーを使用する半教師あり分類パイプ

CNN

embedding

semi-supervised

COVID-19

arXiv reaDer

CT

classification

representation learning

arXiv

attention
リンク
回転不変性と広範なデータ拡張：有糸分裂領域一般化（MIDOG）チャレンジの戦略
arxiv_reader 2021/09/03
組織病理学画像内の有糸分裂像の自動検出は困難な作業です。ここでは、MIDOG2021コンテストに参加するために適用した戦略を説明するさまざまな手順を示します。コンテストの目的は、4つの独立したソースス

convolutional

augmentation

dataset

arXiv reaDer

domain

detection

learning

arXiv
リンク
USCL：ビデオ対比表現学習による深部超音波画像診断モデルの事前トレーニング
arxiv_reader 2021/09/03
ほとんどの深部神経ネットワーク（DNN）ベースの超音波（US）医療画像分析モデルは、モデルの一般化を改善するために、事前にトレーニングされたバックボーン（ImageNetなど）を使用します。ただし、自

DNN

semi-supervised

dataset

arXiv reaDer

domain

video

contrastive learning

representation learning

arXiv
リンク
乳がんの組織学的サンプルにおけるディープラーニングベースの有糸分裂検出
Deep Learning-based mitosis detection in breast cancer histologic samples これは、MIDOG2021チャレンジのコンテキストでの有糸分裂検出の提出です。これは、ニューラルネットワークアーキテクチャのバックボーンとして、2段階の異議モデルFasterR CNNとDenseNetに基づいています。予備テストフェーズリーダーボードで0.6645のF1スコアを達成します。 This is the submission for mitosis detection in the context of the MIDOG 2021 challenge. It is based on the two-stage objection model Faster RCNN as well as DenseNet as a backbone
arxiv_reader 2021/09/03
これは、MIDOG2021チャレンジのコンテキストでの有糸分裂検出の提出です。これは、ニューラルネットワークアーキテクチャのバックボーンとして、2段階の異議モデルFasterRCNNとDenseNet

R-CNN

arXiv reaDer

arXiv

detection
リンク
不均一なラベルで仏の顔から構築された年の予測
arxiv_reader 2021/09/03
仏像は人間の文化、特にアジア地域の一部であり、2、000年以上にわたって人間の文明と並んでいます。歴史が進むにつれ、戦争や自然災害などの理由で、仏像の建造年数を示す記録が失われ、歴史家が建造年数を見積

manifold

human

loss function

arXiv reaDer

face

arXiv
リンク
温室内のトマトを検出するためのシングルショットマルチボックス検出器とYOLO深層学習モデルの評価
arxiv_reader 2021/09/03
農業向けのロボットソリューションの開発には、あらゆる作物段階で確実に機能する高度な知覚機能が必要です。たとえば、温室でのトマトの収穫プロセスを自動化するには、視覚認識システムがライフサイクルのあらゆる

real time

dataset

arXiv reaDer

single-shot

robot

detection

YOLO

learning

arXiv
リンク
解剖学的にガイドされた注意が教師なしPET画像のノイズ除去性能を強化します
arxiv_reader 2021/09/03
教師あり畳み込みニューラルネットワーク（CNN）は、陽電子放出断層撮影（PET）画像のノイズ除去のための従来の代替手段よりも優れていることがよくありますが、多くの低品質および高品質の参照PET画像ペア

CNN

denoising

3D

arXiv reaDer

unsupervised

simulation

arXiv

attention
リンク
コンピュータビジョンにおける敵対的攻撃と防御の進歩：調査
arxiv_reader 2021/09/03
ディープラーニング（DL）は、現代のコンピュータービジョンの分野で最も広く使用されているツールです。複雑な問題を正確に解決するその能力は、セキュリティクリティカルなアプリケーションを含むさまざまなタス

computer vision

arXiv reaDer

domain

adversarial

video

learning

arXiv

attention
リンク
マルチモーダルゼロショット手話認識
ゼロショット学習（ZSL）は、近年急速に進歩しています。手話認識（SLR）の注釈のボトルネックを克服するために、テキストによる説明を活用して、注釈付きの視覚的な例のないゼロショット手話認識（ZS-SLR）のアイデアを探ります。このように、スケルトンベースのものと融合した深い特徴の補完的な機能を利用したマルチモーダルゼロショット手話認識（ZS-SLR）モデルを提案します。 Transf ormerベースのモデルとC3Dモデルは、それぞれ手の検出と深部特徴抽出に使用されます。スケルトンベースの機能と深い機能の次元の間でトレードオフを行うために、Long Short Term Memory（LSTM）ネットワーク上でAuto-Encoder（AE）を使用します。最後に、セマンティックスペースを使用して、視覚的特徴をクラスラベルの言語埋め込みにマッピングします。これは、トランスフォーマーからの双方向
arxiv_reader 2021/09/03
ゼロショット学習（ZSL）は、近年急速に進歩しています。手話認識（SLR）の注釈のボトルネックを克服するために、テキストによる説明を活用して、注釈付きの視覚的な例のないゼロショット手話認識（ZS-SL

embedding

LSTM

transformer

dataset

representation

arXiv reaDer

detection

zero-shot

BERT

arXiv
リンク
シャムネットワークを使用した半教師あり学習
arxiv_reader 2021/09/03
ニューラルネットワークは、多数のラベル付きサンプルでトレーニングされたときに最先端の結果をもたらす分類モデルとして正常に使用されています。ただし、これらのモデルは、ラベル付けされていないインスタンスが

embedding

semi-supervised

representation

arXiv reaDer

classification

learning

arXiv
リンク
事前にトレーニングされたモデルの重みを転送すると、半教師あり画像の分類が大幅に向上します
arxiv_reader 2021/09/03
ディープニューラルネットワークは、多数のラベル付きの例でトレーニングすると最先端の結果を生成しますが、トレーニングに少量のラベル付きの例を使用すると過剰適合する傾向があります。ラベル付きの例を多数作成

semi-supervised

transfer learning

dataset

arXiv reaDer

domain

classification

metric learning

arXiv
リンク
層状材料の非写実的レンダリング：マルチスペクトルアプローチ
arxiv_reader 2021/09/03
生物学的標本に見られる層状物質を視覚化するためのマルチスペクトルレンダリング技術を紹介します。非写実的レンダリング（NPR）に、近赤外線および紫外線スペクトルから取得したデータを使用するのは初めてです

arXiv reaDer

arXiv

detection
リンク
自己監視による画像分類のためのより良い自己訓練
arxiv_reader 2021/09/03
自己トレーニングは、単純な半教師あり学習アプローチです。信頼性の高い予測を引き付けるラベルのない例には、予測のラベルが付けられ、トレーニングセットに追加されます。このプロセスは、複数回繰り返されます。

semi-supervised

dataset

arXiv reaDer

self-supervised

classification

learning

arXiv
リンク
ディープイメージプリアーとフォワードプロジェクションモデルを組み込んだ直接PET画像再構成
arxiv_reader 2021/09/03
畳み込みニューラルネットワーク（CNN）は、最近、陽電子放出断層撮影（PET）画像の再構成において目覚ましいパフォーマンスを達成しました。特に、サイノグラムから再構成された画像を直接生成するCNNベー

CNN

reconstruction

loss function

dataset

arXiv reaDer

unsupervised

simulation

arXiv
リンク
複雑なターゲットシーンの3Dモデリングによる現実世界の敵対的パッチの強化
arxiv_reader 2021/09/03
敵対的な例は、特に画像領域において、深層学習モデルに対する懸念の脅威であることが証明されています。ただし、多くの研究で現実世界の敵対的な例が調査されていますが、それらのほとんどは攻撃シーンの2D写真に

approximation

3D

arXiv reaDer

domain

adversarial

learning

simulation

arXiv
リンク
畳み込みニューラルネットワークを使用した3D地質モデルからの3D鉱物の見通しの学習：構造制御された熱水金鉱床への適用
arxiv_reader 2021/09/03
3次元（3D）地質モデルは、3D鉱物予測モデリングの典型的かつ重要なデータソースです。 3D地質モデルから見通しに役立つ予測変数を特定することは、困難で退屈な作業です。畳み込みニューラルネットワーク（

CNN

3D

disentangling

arXiv reaDer

learning

arXiv
リンク
CNNベースの画像超解像のための効率的なデュアルリファレンストレーニングデータ取得方法
arxiv_reader 2021/09/03
画像の超解像の深層学習方法の場合、最も重要な問題は、トレーニング用の低解像度と高解像度のペアの画像が実際のカメラのサンプリングプロセスを正確に反映しているかどうかです。既存の劣化モデル（バイキュービッ

CNN

super-resolution

human

3D

dataset

arXiv reaDer

learning

arXiv
リンク
モデルベースとモデルフリーの人間の再構築の間のギャップを埋める
arxiv_reader 2021/09/03
さまざまな衣服スタイルの体型は多様性と複雑性が高いため、単一の画像から人間の形状を直接推定することは困難です。モデルベースのアプローチのほとんどは、表面が滑らかすぎる最小限の服を着た体の形状とポーズを

CNN

human

pose

reconstruction

dataset

arXiv reaDer

mesh

arXiv
リンク
意味的に整列されたスタイル転送のためのマニホールド整列
arxiv_reader 2021/09/03
ほとんどの既存のスタイル転送方法は、スタイルをグローバル統計（グラム行列や共分散行列など）で表すことができるという仮定に従っており、出力画像とスタイル画像に同様のグローバル統計を強制することで問題に対

arXiv reaDer

semantic segmentation

arXiv

manifold
リンク
FBSNet：リアルタイムセマンティックセグメンテーションのための高速バイラテラル対称ネットワーク
arxiv_reader 2021/09/03
入力画像のピクセルレベルの分類タスクとして視覚的に理解できるリアルタイムのセマンティックセグメンテーションは、現在、特に自動運転やドローンナビゲーションの急速に発展している分野で幅広いアプリケーション

real time

autonomous driving

dataset

arXiv reaDer

drone

classification

semantic segmentation

arXiv
リンク
AnANet：クロスモーダル相関分類のためのモデリングの関連付けと調整
arxiv_reader 2021/09/03
マルチモーダルデータの爆発的な増加は、厳密な事前の関連する仮定に従う多くのクロスモーダルアプリケーションで大きな需要を生み出します。したがって、研究者はクロスモーダル相関カテゴリの定義を研究し、さまざ

dataset

arXiv reaDer

classification

arXiv

attention
リンク
UVマッピングによるディープフェイスビデオインペインティング
このペーパーでは、フェイスビデオの修復の問題について説明します。既存のビデオ修復方法は、主に繰り返しパターンのある自然なシーンを対象としています。破損した顔の対応を取得するために、顔に関する事前の知識を利用しません。したがって、特に顔のコンポーネントがフレーム間で非常に異なって表示される大きなポーズや表情のバリエーションの下にある顔の場合、これらは次善の結果しか達成しません。本論文では、顔ビデオ修復のための2段階の深層学習法を提案する。画像空間とUV（テクスチャ）空間の間で顔を変換する前に、3D顔として3DMMを使用します。ステージIでは、UV空間でフェイスインペインティングを行います。これにより、顔のポーズや表情の影響を大幅に取り除くことができ、顔の特徴を適切に調整することで学習タスクがはるかに簡単になります。フレームごとの注意モジュールを導入して、隣接するフレームの対応を十分に活用し、
arxiv_reader 2021/09/03
このペーパーでは、フェイスビデオの修復の問題について説明します。既存のビデオ修復方法は、主に繰り返しパターンのある自然なシーンを対象としています。破損した顔の対応を取得するために、顔に関する事前の知識

pose

3D

arXiv reaDer

video

face

learning

arXiv

attention
リンク
GAN法を使用した夜間の可視光気象衛星画像の合成
arxiv_reader 2021/09/03
気象衛星の可視光画像は、気象のサポートと予測にとって重要です。ただし、夜間はそのようなデータはありません。これを克服するために、深層学習に基づいて夜間に合成衛星可視光画像を作成する方法を提案します。具

learning

arXiv reaDer

GAN

synthesis

satellite

arXiv

attention
リンク
より堅牢な一般化のための地域の敵対的訓練
arxiv_reader 2021/09/03
敵対者訓練（AT）は、さまざまな敵対者の攻撃に対する最も有望な防御方法の1つとして実証されています。私たちの知る限り、既存のATベースの方法は通常、局所的に最も敵対的な摂動点でトレーニングし、すべての

dataset

gradient

arXiv reaDer

adversarial

benchmark

arXiv
リンク
可逆モダリティ合成のための可変増補ネットワーク-融合
arxiv_reader 2021/09/03
さまざまなモダリティの下で複数の医用画像に含まれる情報を統合する効果的な方法として、医用画像の合成と融合が、疾患の診断や治療計画などのさまざまな臨床アプリケーションで登場しています。この論文では、医用

synthesis

arXiv reaDer

arXiv

augmentation
リンク
解きほぐされた高品質の顕著な物体検出
arxiv_reader 2021/09/03
視覚シーンから最も特徴的なオブジェクトを発見して特定することを目的とした、顕著なオブジェクト検出（SOD）は、さまざまなコンピュータービジョンシステムで重要な役割を果たします。高解像度の時代に入ると、

computer vision

disentangling

dataset

saliency

arXiv reaDer

benchmark

detection

classification

learning

arXiv
リンク
ダッシュ：動的しきい値処理を使用した半教師あり学習
arxiv_reader 2021/09/03
半教師あり学習（SSL）は、ラベルなしデータの使用に成功したため、多くの機械学習タスクで大きな注目を集めていますが、既存のSSLアルゴリズムでは、すべてのラベルなしの例、またはトレーニングの進行中に固

semi-supervised

arXiv reaDer

benchmark

arXiv

learning
リンク
効率的なマルチステージビジョントランスフォーマーの検索
arxiv_reader 2021/09/03
Vision Transformer（ViT）は、自然言語処理用のTransformerをコンピュータービジョンタスクに適用でき、コンピュータービジョンで長年研究および採用されてきた畳み込みニューラル

CNN

residual

computer vision

transformer

arXiv reaDer

NAS

arXiv
リンク
主観的に注釈が付けられた視覚認識タスクのためのベイズ評価フレームワーク
A Bayesian Evaluation Framework for Subjectively Annotated Visual Recognition Tasks 自動視覚認識の興味深い開発は、画像に客観的なラベルを割り当てることができないが、それでも画像に関する人間の判断を反映する注釈を収集することが可能なタスクの出現です。これらのタスクの機械学習ベースの予測子は、アノテーターの動作をモデル化する教師ありトレーニングに依存しています。つまり、画像に対する平均的な人の判断はどうなるでしょうか。このタイプの作業、特に人間の行動との不一致が倫理的失効につながる可能性があるアプリケーションの重要な未解決の質問は、訓練された予測子の認識論的不確実性、つまり予測子のモデルから生じる不確実性をどのように評価するかです。予測子の内部構造にとらわれない、この体制でブラックボックス予測子を評価するための
arxiv_reader 2021/09/03
自動視覚認識の興味深い開発は、画像に客観的なラベルを割り当てることができないが、それでも画像に関する人間の判断を反映する注釈を収集することが可能なタスクの出現です。これらのタスクの機械学習ベースの予測

estimation

human

Bayesian

arXiv reaDer

face

classification

arXiv
リンク
UAVRGB画像を使用したフィールドベースのプロット抽出
arxiv_reader 2021/09/03
無人航空機（UAV）は、野外試験で高解像度のデータを取得できるため、トウモロコシやソルガムなどの野外作物の植物表現型の使用に人気があります。数千の植物を含む可能性のある野外実験は、品種または管理慣行を

arXiv reaDer

arXiv

UAV
リンク
脳腫瘍セグメンテーションのためのエンドツーエンドの学習可能なフロー正則化モデル
arxiv_reader 2021/09/03
生物医学画像の多くのセグメンテーションタスクは、エネルギー関数の最小化としてモデル化でき、最大フローおよび最小カット最適化アルゴリズムのクラスによって解決できます。ただし、従来のエネルギー関数は通常、

arXiv reaDer

segmentation

arXiv

U-Net
リンク
単一画像からの新しいオブジェクト形状の3D再構成
arxiv_reader 2021/09/03
単一の画像から任意のポーズの任意のオブジェクトの3D形状を正確に予測することは、コンピュータービジョン研究の重要な目標です。これは、限られたトレーニングセットを使用して、オブジェクトの可視部分と遮蔽部

pose

computer vision

reconstruction

3D

representation

arXiv reaDer

arXiv
リンク
WebQA：マルチホップおよびマルチモーダルQA
arxiv_reader 2021/09/03
Web検索は、基本的にマルチモーダルでマルチホップです。多くの場合、質問をする前でも、画像検索に直接アクセスして回答を見つけることを選択します。さらに、単一のソースから回答を見つけることはめったにあり

computer vision

transformer

representation

arXiv reaDer

reasoning

benchmark

arXiv
リンク
リソースの制約下でデータセットの品質を向上させるためのアクティブなラベルクリーニング
arxiv_reader 2021/09/03
ラベルノイズとして知られるデータ注釈の欠陥は、機械学習モデルのトレーニングに悪影響を及ぼし、モデルのパフォーマンスの評価に見過ごされがちな交絡効果をもたらします。それにもかかわらず、専門家を雇って大き

dataset

arXiv reaDer

benchmark

learning

simulation

arXiv
リンク
グローバルに相関する最尤法を使用した肺疾患の分類：畳み込みニューラルネットワークの補助的注意メカニズム
Pulmonary Disease Classification Using Globally Correlated Maximum Likelihood: an Auxiliary Attention mechanism for Convolutional Neural Networks 畳み込みニューラルネットワーク（CNN）は、胸部X線写真の肺の異常を分類および検出するために現在広く使用されています。 CNNの2つの補完的な一般化プロパティ、並進不変性と同変は、画像内の空間的な位置に関係なく、肺疾患に関連する明らかな異常を検出するのに特に役立ちます。ただし、これらのプロパティには、ローカル領域で検出された異常の正確な空間情報とグローバルな相対位置の損失も伴います。このような異常のグローバルな相対位置は、COVID-19やウイルス性肺炎などの同様の状態を区別するのに役立つ可能性がありま
arxiv_reader 2021/09/03
畳み込みニューラルネットワーク（CNN）は、胸部X線写真の肺の異常を分類および検出するために現在広く使用されています。 CNNの2つの補完的な一般化プロパティ、並進不変性と同変は、画像内の空間的な位置

CNN

bias

transformer

COVID-19

arXiv reaDer

saliency

classification

arXiv

attention
リンク
ベンガルのナンバープレートを認識するための自動化されたアプローチ
An Automated Approach for the Recognition of Bengali License Plates 自動ナンバープレート認識（ALPR）は、任意の車両のナンバープレートを自動的に識別するためのシステムです。このプロセスは、とりわけ、追跡、発券、およびあらゆる請求システムにとって重要です。情報通信技術（ICT）の使用により、車両追跡システムを含むすべてのシステムが自動化されています。本研究では、ナンバープレートの文字を使用してナンバープレートを検出するハイブリッド手法を提案します。撮影した画像情報は、本研究のテーマであるバングラデシュ車の認識手順に使用されました。ここでは、ナンバープレートの検出に、81％が正しく予測されたYOLOモデルが使用されました。そして、ナンバープレートのセグメンテーションには大津のしきい値処理が使用され、最終的には文字認識にCNN
arxiv_reader 2021/09/03
自動ナンバープレート認識（ALPR）は、任意の車両のナンバープレートを自動的に識別するためのシステムです。このプロセスは、とりわけ、追跡、発券、およびあらゆる請求システムにとって重要です。情報通信技術

CNN

vehicle

arXiv reaDer

detection

YOLO

tracking

segmentation

arXiv
リンク
公正な表現：未知のタスクに対しておおよその複数のグループの公平性を保証する
arxiv_reader 2021/09/03
データがさまざまな予測タスクに使用されるシナリオに動機付けられて、公平な表現を使用して、未知のタスクと複数の公平性の概念の公平性を同時に保証できるかどうかを調査します。独立性、分離、およびキャリブレー

dataset

representation

arXiv reaDer

face

learning

arXiv
リンク
有糸分裂検出のためのフーリエ領域を持つSk-Unetモデル
arxiv_reader 2021/09/03
有糸分裂数は、乳がんの等級付けの最も重要な形態学的特徴です。多くの深層学習ベースの方法が提案されていますが、ドメインシフトに悩まされています。この作業では、問題に対処するために有糸分裂検出のためのフー

arXiv reaDer

domain

detection

segmentation

arXiv
リンク
マルチスキャナー乳がんの組織病理学的画像における有糸分裂検出のためのドメイン適応技術の評価
Assessing domain adaptation techniques for mitosis detection in multi-scanner breast cancer histopathology images 乳がんは世界で最も蔓延しているがんであり、毎年200万人以上の新しい症例が診断されています。腫瘍の等級付けプロセスの一環として、組織病理学者は、有糸分裂と呼ばれる生物学的プロセスで、分裂している細胞の数を手動で数えます。人工知能（AI）法は、有糸分裂像を自動的に検出するために開発されましたが、これらの方法は、元の（トレーニング）ドメインの外部からのデータに適用するとパフォーマンスが低下することがよくあります。さまざまなスキャナーを使用してデジタル化。ドメイン適応の一形態であるスタイル転送は、画像を異なるドメインから共有の視覚的外観に変換する手段を提供し、ドメインシフ
arxiv_reader 2021/09/03
乳がんは世界で最も蔓延しているがんであり、毎年200万人以上の新しい症例が診断されています。腫瘍の等級付けプロセスの一環として、組織病理学者は、有糸分裂と呼ばれる生物学的プロセスで、分裂している細胞の

arXiv reaDer

U-Net

detection

domain adaptation

arXiv
リンク
TransforMesh：解剖学的メッシュの縦方向モデリングのためのトランスフォーマーネットワーク
Transf orMesh: A Transf ormer Network for Longitudinal modeling of Anatomical Meshes アルツハイマー病（AD）に関連する神経解剖学的変化の縦断的モデリングは、疾患の進行を研究するために重要です。この目的のために、3D解剖学的メッシュの縦方向の形状変化をモデル化するトランスフォーマーに基づく時空間ネットワークであるTransf orMeshを紹介します。トランスフォーマーとメッシュネットワークは最近、自然言語処理とコンピュータービジョンで印象的なパフォーマンスを示していますが、医療画像分析への適用は非常に限られています。私たちの知る限り、これは変圧器とメッシュネットワークを組み合わせた最初の作業です。私たちの結果は、Transf orMeshが、時間依存性をキャプチャしない他のベースラインアーキテクチャよりも優れた形
arxiv_reader 2021/09/03
アルツハイマー病（AD）に関連する神経解剖学的変化の縦断的モデリングは、疾患の進行を研究するために重要です。この目的のために、3D解剖学的メッシュの縦方向の形状変化をモデル化するトランスフォーマーに基

spatio-temporal

computer vision

3D

transformer

arXiv reaDer

mesh

arXiv
リンク
ビジュアルカメラの再ローカリゼーションにおける疑似グラウンドトゥルースの限界について
arxiv_reader 2021/09/03
カメラのポーズの精度を測定するベンチマークデータセットは、視覚的な再ローカリゼーション研究の進歩を後押ししました。何千もの画像のポーズを取得するには、参照アルゴリズムを使用して疑似グラウンドトゥルース

SLAM

pose

dataset

arXiv reaDer

benchmark

arXiv
リンク
開集合ビデオドメイン適応のための条件付き極値理論
arxiv_reader 2021/09/03
メディアストリーミングの出現により、ビデオアクション認識はさまざまなアプリケーションにとってますます重要になっていますが、大規模なデータラベリングが必要になるという高額な費用がかかります。高価なデータ

dataset

arXiv reaDer

video

adversarial

action recognition

learning

domain adaptation

arXiv
リンク
有糸分裂DOmain一般化（MIDOG）チャレンジのためのドメイン適応カスケードR-CNN
Domain Adaptive Cascade R-CNN for MItosis DOmain Generalization (MIDOG) Challenge デジタル組織病理学画像の有糸分裂検出のためのドメイン適応カスケードR-CNN法の概要を提示します。包括的なデータ拡張と既存の一般的な検出アーキテクチャの適応により、提案された方法は、MICCAI2021のMItosis DOmain Generalization（MIDOG）チャレンジで設定された予備テストで0.7500のF1スコアを達成しました。 We present a summary of the domain adaptive cascade R-CNN method for mitosis detection of digital histopathology images. By comprehensive data
arxiv_reader 2021/09/03
デジタル組織病理学画像の有糸分裂検出のためのドメイン適応カスケードR-CNN法の概要を提示します。包括的なデータ拡張と既存の一般的な検出アーキテクチャの適応により、提案された方法は、MICCAI202

augmentation

arXiv reaDer

domain

detection

R-CNN

arXiv
リンク
ロボットエージェントに搭載されたリアルタイムトレーニングに対する自律的な好奇心
arxiv_reader 2021/09/03
学習には勉強と好奇心の両方が必要です。優れた学習者は、与えられたデータから情報を抽出するのが得意であるだけでなく、学ぶべき適切な新しい情報を見つけるのにも熟練しています。これは、人間のオペレーターがグ

real time

reinforcement learning

human

arXiv reaDer

robot

detection

arXiv
リンク
理想とバーチャルリアリティ
arxiv_reader 2021/09/03
世界の進歩のための主なステップは、今日のバーチャルリアリティ内で科学と教育のための常に存在する理想を共有し続けることです。オンライン教育は、進行中のSARS-CoV-2パンデミックの間に人々が教え、学

arXiv reaDer

video

arXiv

human
リンク
生成的敵対的ネットワークと顔のランドマーク検出によるきめ細かい画像分類に向けて
Towards Fine-grained Image Classification with Generative Adversarial Networks and Facial Landmark Detection カテゴリを区別するには複雑で局所的な違いを学習する必要があるため、きめ細かい分類は依然として困難な作業です。画像内のオブジェクトのポーズ、スケール、および位置の多様性は、問題をさらに困難にします。最近のVisionTransf ormerモデルは高性能を実現していますが、大量の入力データが必要です。この問題に対処するために、GANベースのデータ拡張を最大限に活用して、追加のデータセットインスタンスを生成しました。 Oxford-IIIT Petsは、この実験で選択したデータセットでした。スケール、ポーズ、照明が異なる37品種の猫と犬で構成されているため、分類作業の難しさが増して
arxiv_reader 2021/09/03
カテゴリを区別するには複雑で局所的な違いを学習する必要があるため、きめ細かい分類は依然として困難な作業です。画像内のオブジェクトのポーズ、スケール、および位置の多様性は、問題をさらに困難にします。最近

pose

transformer

augmentation

dataset

arXiv reaDer

GAN

detection

classification

landmark

arXiv
リンク
生物と遺物をその形状で分類する
オブジェクトを形状で分類したいことがよくあります。確かに、形状の研究は、進化生物学、構造生物学、画像処理、考古学などの多くの科学分野の重要な部分です。最も広く使用されている形状分析の方法であるGeometricMorphometricsは、形状が表される数学的空間が線形であることを前提としています。しかし、形状空間は実際にはかなり複雑であり、確かに非線形であることが長い間知られていました。この非線形性を考慮に入れて、形状間の距離をより正確に推定する微分同相写像法は存在しますが、実際の問題に適用されることはめったにありません。機械分類器を使用して、さまざまな有機および人工のオブジェクトの形状を記述および分類するこれらのメソッドのいくつかの機能をテストしました。 1つの方法である平方根速度関数（SRVF）は、標準の幾何学的形態計測法（固有形状）を含む他のすべての方法よりも優れていることがわかり
arxiv_reader 2021/09/03
オブジェクトを形状で分類したいことがよくあります。確かに、形状の研究は、進化生物学、構造生物学、画像処理、考古学などの多くの科学分野の重要な部分です。最も広く使用されている形状分析の方法であるGeom

classification

arXiv reaDer

arXiv

human
リンク
反復ドメイン対応マルチターゲット適応
ほとんどのドメイン適応方法は、単一ソース-単一ターゲット適応設定に焦点を合わせています。マルチターゲットドメインの適応は、ラベルのない複数のターゲットドメインに対して単一の分類子が学習される強力な拡張機能です。マルチターゲット分類子を構築するには、ラベル付きソースとラベルなしのさまざまなターゲットドメインから機能を効果的に集約することが重要です。これに向けて、最近導入されたドメイン対応カリキュラムグラフ共同教育（D-CGCT）は、グラフニューラルネットワークに基づくデュアル分類器ヘッドを活用しています。 D-CGCTは、ネットワークがそのようなターゲットドメインへの適応が容易であると想定して、ソースにより類似したターゲットドメインから開始して一度に1つのドメインを適応させるシーケンシャル適応戦略を使用します。ただし、絶対的な意味で簡単なドメインや難しいドメインはなく、各ドメインには異なる特
arxiv_reader 2021/09/03
ほとんどのドメイン適応方法は、単一ソース-単一ターゲット適応設定に焦点を合わせています。マルチターゲットドメインの適応は、ラベルのない複数のターゲットドメインに対して単一の分類子が学習される強力な拡張

dataset

arXiv reaDer

domain adaptation

arXiv
リンク
知覚的に最適化されたディープハイダイナミックレンジイメージトーンマッピング
arxiv_reader 2021/09/03
計算効率が高く、知覚的に最適化された、ディープハイダイナミックレンジ（HDR）イメージトーンマッピング演算子について説明します。まず、HDR画像を正規化されたラプラシアンピラミッドに分解し、2つのディ

DNN

metric

representation

arXiv reaDer

arXiv
リンク
自己較正神経放射輝度フィールド
arxiv_reader 2021/09/03
この作業では、任意の非線形歪みを持つ一般的なカメラのカメラセルフキャリブレーションアルゴリズムを提案します。キャリブレーションオブジェクトを使用せずに、シーンのジオメトリと正確なカメラパラメータを共同

pose

differentiable

loss function

dataset

arXiv reaDer

learning

arXiv
リンク
プロトタイプに基づく識別可能な潜在的埋め込みによる異常検出
arxiv_reader 2021/09/03
ビデオ異常検出（VAD）に向けた最近の取り組みは、小さな再構成エラーを伴う通常のイベントパターンを記述するためのディープオートエンコーダーを学習しようとしています。再構成エラーが大きいビデオ入力は、テ

embedding

reconstruction

loss function

dataset

arXiv reaDer

anomaly detection

video

benchmark

optical flow

arXiv
リンク
TLRM：GNNベースの少数ショット学習のためのタスクレベルの関係モジュール
arxiv_reader 2021/09/03
最近、グラフニューラルネットワーク（GNN）は、クラスごとに限られたラベル付きサンプルでトレーニングされたときに見えないサンプルを分類することを目的とした、数ショットの分類問題を処理する強力な機能を示

embedding

few-shot

metric

representation

arXiv reaDer

benchmark

classification

learning

GNN

arXiv
リンク
セグメントCMRソフトウェアを使用した深層学習ベースの心筋梗塞定量化の評価
arxiv_reader 2021/09/03
この作業は、セグメント心血管磁気共鳴（CMR）ソフトウェアを使用して、深層学習ベースの心筋梗塞（MI）の定量化を評価します。セグメントCMRソフトウェアには、期待値最大化、加重強度、梗塞瘢痕量、梗塞瘢

arXiv reaDer

semantic segmentation

arXiv

U-Net
リンク
LGE-MRIの深層学習ベースのセグメンテーションに対する正則化ハイパーパラメータの影響
arxiv_reader 2021/09/03
任意に選択されたL2正則化ハイパーパラメータ値が深層学習によるセマンティックセグメンテーションの結果にどの程度影響するかが示されます。デモンストレーションは、任意に選択されたL2正則化値を使用して小さ

arXiv

U-Net

dataset

arXiv reaDer

regularization

learning

semantic segmentation
リンク
技術領域におけるデータ効率の良い欠陥分類のためのシャム基底関数ネットワーク
arxiv_reader 2021/09/03
技術分野で深層学習モデルをトレーニングするには、タスクは明確ですが、トレーニングに利用できるデータが不十分であるという課題が伴うことがよくあります。この作業では、シャムネットワークと動径基底関数ネット

arXiv

domain

dataset

arXiv reaDer

classification

learning
リンク
セグメンテーション：セマンティックセグメンテーション用のトランスフォーマー
arxiv_reader 2021/09/03
画像のセグメンテーションは、個々の画像パッチのレベルではあいまいであることが多く、ラベルのコンセンサスに達するにはコンテキスト情報が必要です。この論文では、セマンティックセグメンテーションのトランスフ

arXiv

pre-training

dataset

transformer

arXiv reaDer

classification

embedding

semantic segmentation
リンク
- 2021年9月6日
- 2021年9月3日
- 2021年9月2日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx