Image prediction of disease progression by style-based manifold extrapolation 疾患修飾管理は、症状を緩和するだけでなく、疾患の悪化と進行を防ぐことを目的としています。残念ながら、必要な治療法の開発は、発症前の疾患を認識できず、疾患の発症についての理解が限られているために妨げられることがよくあります。潜在的な外挿最適化アプローチを使用して、個人の進行リスクと形態の予測を可能にする方法論によって、この問題の一般的な解決策を提示します。この目的のために、正則化された生成的敵対的ネットワーク(GAN)と潜在的な最近傍アルゴリズムを組み合わせて共同最適化を行い、将来の時点のもっともらしい画像を生成しました。多施設縦断研究(変形性関節症イニシアチブ、OAI)からの変形性関節症(OA)データで私たちの方法を評価しました。発症前
ディープニューラルネットワーク(DNN)は、画像分類、オブジェクト検出、セマンティックセグメンテーションなどの幅広い視覚認識タスクで大きな進歩を遂げました。畳み込みアーキテクチャの進化により、高価な計算コストが発生するため、パフォーマンスが向上しました。さらに、ネットワーク設計は困難な作業になりました。これは労働集約的であり、高度なドメイン知識を必要とします。このような問題を軽減するために、最適なアーキテクチャを自動的に検索し、人間が設計したモデルよりも優れたパフォーマンスを備えたモデルを実現するさまざまなニューラルアーキテクチャ検索方法の研究が行われています。この調査は、この研究分野の既存の研究の概要を提供することを目的としており、特に、重み共有を使用してすべてのアーキテクチャをサブモデルとして組み立てるニューラルネットワークを構築するスーパーネットの最適化に焦点を当てています。スーパー
画像の曇り除去は、かすんでいる画像から潜在的なかすみのない画像を推定する代表的な低レベルの視覚タスクです。近年、畳み込みニューラルネットワークベースの方法が画像の曇り除去を支配してきました。ただし、最近高レベルの視覚タスクで画期的な進歩を遂げたビジョントランスフォーマーは、画像の曇り除去に新しい次元をもたらしていません。人気のあるSwinTransformerから始めて、その主要なデザインのいくつかが画像の曇り除去に適していないことを発見しました。この目的のために、修正された正規化層、活性化関数、空間情報集約スキームなどのさまざまな改善で構成されるDehazeFormerを提案します。 DehazeFormerの複数のバリアントをさまざまなデータセットでトレーニングして、その有効性を示します。具体的には、最も頻繁に使用されるSOTS屋内セットでは、小型モデルがFFA-Netを上回り、#Pa
Spatial Transformer Network on Skeleton-based Gait Recognition スケルトンベースの歩行認識モデルは、ランク1の精度が通常の歩行の場合の90%からコートを使用した場合の歩行の70%まで変化するため、通常、堅牢性の問題に悩まされます。この作業では、空間トランスフレームワークと時間畳み込みネットワークの組み合わせに基づくGait-TRと呼ばれる最先端の堅牢なスケルトンベースの歩行認識モデルを提案します。 Gait-TRは、他のスケルトンベースの歩行モデルに比べて大幅な改善を実現し、よく知られている歩行データセットCASIA-Bでより高い精度と堅牢性を実現します。特にコートを着た歩行の場合、Gait-TRはランク1の歩行認識精度が90%になります。これは、通常、シルエットベースの歩行認識モデルよりも精度が高いシルエットベースのモデルの最
From 2D Images to 3D Model:Weakly Supervised Multi-View Face Reconstruction with Deep Fusion 限られた数の2D顔画像(3など)を活用して非常に軽い注釈付きの高品質の3D顔モデルを生成する、弱教師あり学習によるマルチビュー3D顔再構成(MVR)の問題を検討します。それらの有望なパフォーマンスにもかかわらず、現在のMVRメソッドは、マルチビュー画像機能を単純に連結し、重要な領域(たとえば、目、眉、鼻、口)にあまり注意を払いません。この目的のために、Deep Fusion MVR(DF-MVR)と呼ばれる新しいモデルを提案し、スキップ接続を備えた単一のデコードフレームワークへのマルチビューエンコーディングを設計し、マルチビューから注意を払って深い特徴を抽出、統合、および補正することができます画像。さらに、
Automated Design of Salient Object Detection Algorithms with Brain Programming コンピュータビジョンの最近の改善にもかかわらず、視覚コンピューティングアルゴリズムの説明がとらえどころのないままであるため、人工視覚システムの設計は依然として困難です。顕著な物体の検出は、脳の内部の働きを理解するのが難しいため、まだ未解決の問題の1つです。この研究分野の進歩は、神経科学の知識を使用した手作りのデザインの伝統的な道をたどっています。近年、遺伝的プログラミングに基づく2つの異なるアプローチが、それらの技術を強化しているように見えます。 1つは、遺伝的プログラミングとファジー論理を介して以前の手作りの方法を組み合わせるという考えに従います。もう1つのアプローチは、人工的な進化を通じて、基本的な手作りモデルの内部計算構造を改善
このホワイトペーパーでは、敵対的な例に対するディープニューラルネットワーク分類器の堅牢性を強化するための、Adaptive-Gravityと呼ばれる新しいモデルトレーニングソリューションを紹介します。各クラスに関連付けられたモデルパラメータ/フィーチャを、その重心の位置と重心の周りのフィーチャの広がり(距離の標準偏差)によって特徴付けられる質量として概念化します。各クラスターに関連付けられた重心を使用して、ネットワークトレーニング中に異なるクラスの重心を互いに遠ざける反重力を導き出します。次に、各クラスの特徴を、反重力によって得られた対応する新しい重心に集中させることを目的とした目的関数をカスタマイズしました。この方法により、異なる質量間の分離が大きくなり、各重心の周りの特徴の広がりが減少します。その結果、サンプルは敵対的な例をマッピングできる空間から押し出され、敵対的な例を作成するために
Mitosis domain generalization in histopathology images -- The MIDOG challenge 腫瘍組織内の有糸分裂像の密度は、腫瘍増殖と高度に相関していることが知られており、したがって、腫瘍の等級付けにおける重要なマーカーです。病理学者による有糸分裂像の認識は、予後の価値を制限する強い評価者間バイアスの影響を受けることが知られています。最先端の深層学習手法は、この評価の専門家をサポートできますが、トレーニングに使用されたものとは異なる臨床環境に適用されると、大幅に悪化することが知られています。基礎となるドメインシフトの決定的な要素の1つは、さまざまなスライドスキャナー全体を使用することによって引き起こされる変動性として特定されています。 MICCAI MIDOG 2021チャレンジの目標は、このドメインシフトに対抗し、スキャナー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く