畳み込みニューラルネットワーク(CNN)は、多くのコンピュータービジョンタスクで広く利用されています。ただし、CNNには固定の受信フィールドがあり、人間の姿勢推定に不可欠な長距離知覚の機能が不足しています。ピクセル間の長距離依存関係をキャプチャする機能により、最近コンピュータビジョンアプリケーションにトランスアーキテクチャが採用され、非常に効果的なアーキテクチャであることが証明されています。人間の姿勢推定におけるその能力を探求することに興味があり、したがって、特徴的なピラミッド融合構造で強化された、変圧器アーキテクチャに基づく新しいモデルを提案します。具体的には、事前にトレーニングされたSwin Transformerをバックボーンとして使用し、入力画像から特徴を抽出します。特徴ピラミッド構造を利用して、さまざまな段階から特徴マップを抽出します。機能を融合することにより、モデルはキーポイン
TriCoLo: Trimodal Contrastive Loss for Fine-grained Text to Shape Retrieval マルチモーダルデータに対する共同埋め込みを学習するための対照的な損失に関する最近の研究は、検索や分類などの下流のタスクで成功しています。一方、3D形状とテキストの共同表現学習の研究は、これまで、表現間の複雑な注意のモデリング、またはマルチタスク学習による埋め込みの改善に主に焦点を当ててきました。大規模なバッチ対照学習により、複雑な注意メカニズムや損失なしにテキスト形状検索でSoTAを達成できることを示します。 3Dおよびテキスト表現のこれまでの研究では、ボクセルまたはテキスト付きのマルチビュー画像のいずれかを使用したバイモーダル表現学習にも焦点が当てられていました。この目的のために、すべてのモダリティに対してさらに高いパフォーマンスとより良
Weakly Supervised Contrastive Learning for Better Severity Scoring of Lung Ultrasound COVID-19のパンデミックの発生とともに、超音波は患者のベッドサイドモニタリングのための効果的なツールとして浮上してきました。このため、AIベースの診断と分析に使用できる大量の肺超音波スキャンが利用可能になりました。超音波スキャンの外観のスコアリングに依存する、いくつかのAIベースの患者重症度スコアリングモデルが提案されています。 AIモデルは、標準化された視覚的特徴に基づいて手動でラベル付けされた超音波外観の重症度スコアを使用してトレーニングされます。ビデオクリップ内のすべての超音波フレームにラベルを付けるという課題に対処します。私たちの対照的な学習方法は、ビデオクリップの重大度ラベルを個々のフレームのノイズの多い
AI-based Carcinoma Detection and Classification Using Histopathological Images: A Systematic Review 組織病理学的画像分析は、癌を診断するためのゴールドスタンダードです。癌腫は癌のサブタイプであり、すべての癌症例の80%以上を占めています。扁平上皮癌と腺癌は、生検スライドの顕微鏡検査によって診断された癌の2つの主要なサブタイプです。ただし、手動の顕微鏡評価は主観的で時間のかかるプロセスです。多くの研究者が、癌腫の検出と分類を自動化する方法を報告しています。癌腫診断の自動化における人工知能(AI)の使用の増加は、ディープネットワークモデルの使用の大幅な増加も明らかにしています。この系統的文献レビューでは、組織病理学的画像を使用した癌腫診断で報告された最先端のアプローチの包括的なレビューを提示しま
Explainable Ensemble Machine Learning for Breast Cancer Diagnosis based on Ultrasound Image Texture Features 画像分類は、乳がん診断の予測モデルを構築するために広く使用されています。ほとんどの既存のアプローチは、そのような診断パイプラインを構築するために、圧倒的に深い畳み込みネットワークに依存しています。これらのモデルアーキテクチャは、パフォーマンスは優れていますが、予測の背後にある内部ロジックへの最小限の洞察を提供するブラックボックスシステムです。予測の説明可能性は癌診断などのアプリケーションに不可欠であるため、これは大きな欠点です。この論文では、超音波画像に基づく乳がん診断のための説明可能な機械学習パイプラインを提案することにより、この問題に対処します。超音波画像の1次および2次
Towards holistic scene understanding: Semantic segmentation and beyond この論文は、視覚的なシーンの理解に取り組み、セグメンテーションのパフォーマンスと一般化、ネットワークのトレーニング効率、および全体的な理解を強化します。まず、ストリートシーンのコンテキストでセマンティックセグメンテーションを調査し、さまざまなデータセットの組み合わせでセマンティックセグメンテーションネットワークをトレーニングします。第2章では、単一の畳み込みバックボーン上で階層分類器のフレームワークを設計し、ピクセルラベル付きデータセットの組み合わせでエンドツーエンドでトレーニングし、一般化可能性と認識可能なセマンティック概念の数を改善します。第3章では、弱い監視によるセマンティックセグメンテーションの強化に焦点を当て、ピクセルごとの監視だけでなく、
Is Contrastive Learning Suitable for Left Ventricular Segmentation in Echocardiographic Images? 対照学習は、ラベル付けされたデータへのアクセスが制限されている多くのアプリケーションで役立つことが証明されています。注釈付きデータの欠如は、臨床専門家に大量のデータに手動で注釈を付けることが難しいため、医療画像のセグメンテーションで特に問題になります。そのようなタスクの1つは、心臓の超音波画像における心臓構造のセグメンテーションです。この論文では、対照的な事前トレーニングが心エコー画像の左心室のセグメンテーションに役立つかどうかを議論します。さらに、これが2つのセグメンテーションネットワークであるDeepLabV3と、一般的に使用されるセグメンテーションネットワークであるUNetに与える影響を調査しま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く