Multi-View Depth Estimation by Fusing Single-View Depth Probability with Multi-View Geometry マルチビュー深度推定方法では、通常、マルチビューコストボリュームの計算が必要になります。これにより、大量のメモリが消費され、推論が遅くなります。さらに、マルチビューマッチングは、テクスチャのないサーフェス、反射サーフェス、および移動するオブジェクトでは失敗する可能性があります。このような故障モードの場合、シングルビュー深度推定方法の方が信頼性が高いことがよくあります。この目的のために、マルチビュー深度推定の精度、堅牢性、および効率を向上させるために、シングルビュー深度確率をマルチビュージオメトリと融合するための新しいフレームワークであるMaGNetを提案します。各フレームについて、MaGNetは、ピクセル単
Leveraging Image-based Generative Adversarial Networks for Time Series Generation 生成モデルは、サンプリング品質、多様性、および機能の解きほぐしに関して大きな成功を収めて画像データを合成します。時系列の生成モデルは、時間的ダイナミクスをキャプチャし、サンプリングの反転を可能にする表現が欠落しているため、これらの利点がありません。この論文は、時系列生成のための画像ベースの生成的敵対的ネットワークの使用を容易にするために、異時点間リターンプロット(IRP)表現を提案します。この表現は、時系列の特性をキャプチャするのに効果的であり、代替の表現と比較して、可逆性とスケール不変性の恩恵を受けます。経験的ベンチマークはこれらの機能を確認し、IRPが勾配ペナルティを備えた既製のWasserstein GANを使用して、特殊
ピクセルごとの精度に加えて、トポロジーの正確さは、衛星画像や生物医学画像などの微細構造を持つ画像のセグメンテーションにも重要です。この論文では、デジタルトポロジーの理論を活用することにより、トポロジーにとって重要な画像内の場所を特定します。これらの重要な場所に焦点を当てることにより、トポロジーの精度を高めるために深い画像セグメンテーションネットワークをトレーニングするための新しいホモトピーワーピングロスを提案します。これらのトポロジー的に重要な場所を効率的に識別するために、距離変換を利用する新しいアルゴリズムを提案します。提案されたアルゴリズムと損失関数は、2Dと3Dの両方の設定で異なるトポロジー構造に自然に一般化されます。提案された損失関数は、ディープネットがトポロジ対応メトリックの観点からパフォーマンスを向上させ、最先端のトポロジ保存セグメンテーション方法よりも優れたパフォーマンスを実
Autonomous Navigation System from Simultaneous Localization and Mapping この論文は、同時ローカリゼーションとマッピング(SLAM)ベースの自律航法システムの開発を提示します。この研究の動機は、内部空間を自律的にナビゲートするための解決策を見つけることでした。インテリアナビゲーションは、永遠に進化する可能性があるため、困難です。この問題を解決することは、清掃、健康産業、製造業などの多くのサービスに必要です。このホワイトペーパーの焦点は、この提案された自律システム用に開発されたSLAMベースのソフトウェアアーキテクチャの説明です。スマート車椅子を対象としたこのシステムの潜在的なアプリケーションが評価されました。現在のインテリアナビゲーションソリューションには、床の黒い線など、ある種のガイドラインが必要です。この提案されたソ
Identifying Class Specific Filters with L1 Norm Frequency Histograms in Deep CNNs ディープニューラルネットワークの解釈可能性は、主要な調査分野になっています。これらのネットワークは多くのタスクで最先端の精度を達成していますが、それらの決定を解釈して説明することは非常に困難です。この作業では、ディープ畳み込みネットワークの最後と最後から2番目の層を分析し、クラスのネットワークの決定に最も貢献する機能のサブセットを識別するための効率的な方法を提供します。クラスごとのそのような特徴の数は、最終層の次元と比較してはるかに少ないため、Deep CNNの決定面は低次元の多様体上にあり、ネットワークの深さに比例することを示します。私たちの方法では、最終層を個別の部分空間に分解できます。これは、完全なネットワークの最終層と比
Single Image Automatic Radial Distortion Compensation Using Deep Convolutional Network 多くのコンピュータビジョンドメインでは、入力画像はピンホールカメラモデルに準拠している必要があります。ピンホールカメラモデルでは、実世界の直線が画像の直線として投影されます。ライブスポーツ放送映像でコンピュータビジョンタスクを実行すると、アルゴリズムが特定のキャリブレーションパターンに依存できないという困難な要件が課せられます。この場合、未知のキャリブレーションされていないカメラ、複雑なテレビレンズに起因する放射状の歪み、歪みを補正するための視覚的な手がかりがほとんどありません。リアルタイムパフォーマンスの必要性。スポーツ放送のアプリケーションドメインで動作する多項式歪みモデルの2つの最高次係数を使用して、リアルタイム
ブレイン・コンピューター・インターフェースは、脳の信号を使用して、実際の制御なしで外部デバイスと通信します。機械学習に基づいて運動イメージを分類するために、多くの研究が行われてきました。ただし、シングルアームモーターイメージなどのまばらな空間特性を持つイメージデータを分類することは、依然として課題です。本論文では、空間的特徴がまばらであっても、脳波信号を2つのグループに分解して運動イメージを分類する方法を提案した。敵対的学習に基づいて、ノイズに対してロバストなEEG信号の共通の特徴を抽出し、信号の特徴のみを抽出することに焦点を当てました。さらに、クラス分類に特化したクラス固有の特徴が抽出されました。最後に、提案された方法は、2つのグループの特徴を1つの埋め込みスペースとして表すことによってクラスを分類します。実験を通じて、特徴を2つのグループに抽出することが、疎な空間特徴を含むデータセット
ST-MTL: Spatio-Temporal Multitask Learning Model to Predict Scanpath While Tracking Instruments in Robotic Surgery 追跡機器を使用したタスク指向の注意の表現学習は、画像誘導ロボット手術において大きな可能性を秘めています。カメラ制御を自動化する認知能力を組み込むことにより、外科医は手術器具の取り扱いにより集中することができます。目的は、手術時間を短縮し、外科医と患者の両方の手術を容易にすることです。リアルタイムの手術器具のセグメンテーションとタスク指向の顕著性検出のために、共有エンコーダーと時空間デコーダーを備えたエンドツーエンドのトレーニング可能な時空間マルチタスク学習(ST-MTL)モデルを提案します。共有パラメーターのMTLモデルでは、複数の損失関数を収束点に最適化すること
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く