End-to-End Rate-Distortion Optimized Learned Hierarchical Bi-Directional Video Compression 従来のビデオ圧縮(VC)方式は、動き補償変換コーディングに基づいており、モーション推定、モードと量子化パラメーターの選択、およびエントロピーコーディングのステップは、エンドツーエンドの最適化問題の組み合わせの性質により、個別に最適化されます。学習したVCにより、非線形変換、モーション、およびエントロピーモデルのエンドツーエンドのレート歪み(RD)最適化トレーニングを同時に実行できます。学習したVCに関するほとんどの作業では、連続するフレームのペアで平均化されたRD損失に基づいて、シーケンシャルビデオコーデックのエンドツーエンドの最適化を検討しています。従来のVCでは、過去と将来の両方の参照フレームを使用できるた
このペーパーでは、AAAI 2022でのマルチモーダルファクト検証(Factify)チャレンジの参加者システムについて説明します。テキストベースの検証手法と事前にトレーニングされた大規模なマルチモーダルモデルのクロスビジョンと言語の最近の進歩にもかかわらず、適用する作業は非常に限られています。ファクトチェックプロセスを自動化するためのマルチモーダル手法。特に、ソーシャルメディア上の画像やビデオに関するクレームやフェイクニュースの蔓延を考慮します。私たちの仕事では、チャレンジはマルチモーダル含意タスクとして扱われ、マルチクラス分類として組み立てられます。アンサンブルモデル(2つのユニモーダルモデルを組み合わせたもの)とマルチモーダルアテンションネットワーク(クレームと証拠文書からの画像とテキストのペア間の相互作用をモデル化したもの)を含む2つのベースラインアプローチが提案され、検討されていま
Sparse Coding with Multi-Layer Decoders using Variance Regularization l_1ペナルティと学習された線形ディクショナリを使用したスパースコーディングでは、コードのl_1ノルムの崩壊を防ぐために、ディクショナリを正則化する必要があります。通常、この正則化は、辞書の要素のユークリッド規範を制限することを伴います。この作業では、デコーダーを正則化する必要なしにコードの崩壊を防ぐ新しいスパースコーディングプロトコルを提案します。私たちの方法は、コードを直接正規化して、各潜在コードコンポーネントが、特定の入力セットのスパース表現のセットに対して固定しきい値よりも大きい分散を持つようにします。さらに、線形辞書よりも複雑な関係をモデル化できるため、マルチレイヤーデコーダーを使用してスパースコーディングシステムを効果的にトレーニングする方
Coherence Learning using Keypoint-based Pooling Network for Accurately Assessing Radiographic Knee Osteoarthritis 膝変形性関節症(OA)は、世界中の多くの高齢者に影響を与える一般的な変性関節障害です。変形性膝関節症の重症度の正確なX線写真による評価は、慢性的な患者管理において重要な役割を果たします。現在臨床的に採用されている膝OAグレーディングシステムは、観察者の主観であり、評価者間の不一致に苦しんでいます。この作業では、複合および細粒度のOAグレードの両方のより正確で一貫性のある評価を同時に提供するためのコンピューター支援診断アプローチを提案します。ラベルのないデータから学習することにより、複合および細粒度のOAグレードの基礎となるコヒーレンスを活用するための新しい半教師あり
新しい挑戦的なデータセット、CPPE-5(医療用個人用保護具)を提示します。これは、医療用個人用保護具の下位分類の研究を可能にすることを目的としています。これは、幅広いレベルのカテゴリに焦点を当てた他の一般的なデータセットでは不可能です( PASCAL VOC、ImageNet、Microsoft COCO、OpenImagesなどとして)。このデータセットでトレーニングされたモデルを複雑なシーンの実際のシナリオで簡単に使用できるようにするために、データセットには主に、自然なコンテキストで各シーンに複数のオブジェクトがある複雑なシーンを示す画像が含まれています。このデータセットの画像コレクションは、できるだけ多くの非象徴的な画像を取得し、この領域の他の既存のデータセットとは異なり、すべての画像が実際の画像であることを確認することに重点を置いています。データセットには5つのオブジェクトカテゴ
デジタル化プロセス中にトポロジを維持することは、最初に重要な要件です。この目的のために、デジタル幾何学では、形状の境界がほぼ規則的であると想定するのが古典的です。準規則性は、正のリーチを持つこと、またはリプシッツ導関数を使用した曲線のクラスC1,1に属することと同等であることが証明されました。最近、鈍角のポリゴン、局所的にターンバウンドされたカーブを含む、より大きなクラスを使用することを提案しました。このテクニカルレポートの目的は、曲率の概念、つまり積分曲率のみを使用して、局所的に曲がりくねった曲線のクラス内の準規則曲線のクラスを定義することです。より正確に言うと、以前の記事で、パーレギュラー曲線が局所的にターンバウンドであることをすでに証明しました。ちなみに、この証明は、準規則曲線のターンがそれらの長さのリプシッツ関数であることを示すために私たちを導きます。この後者の特性を検証する曲線の
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く