MyoPS: A Benchmark of Myocardial Pathology Segmentation Combining Three-Sequence Cardiac Magnetic Resonance Images 心筋梗塞に苦しむ患者の診断と治療管理には心筋の生存能力の評価が不可欠であり、心筋の病理の分類がこの評価の鍵となります。この作業は、医療画像分析の新しいタスクを定義します。つまり、MICCAI 2020と組み合わせてMyoPSチャレンジで最初に提案された3シーケンス心臓磁気共鳴(CMR)画像を組み合わせた心筋病理セグメンテーション(MyoPS)を実行します。 45のペアで事前に位置合わせされたCMR画像を提供し、病理学のセグメンテーションのために3つのCMRシーケンスからの補足情報をアルゴリズムが組み合わせることができるようにしました。この記事では、課題の詳細を示し
Transfer Learning for Scene Text Recognition in Indian Languages 複数のスクリプト、フォント、テキストサイズ、向きなどの複雑さのため、リソースの少ないインドの言語でのシーンテキスト認識は困難です。この作業では、英語から2つの一般的なインドの言語までのディープシーンテキスト認識ネットワークのすべてのレイヤーの転移学習の力を調査します。一般化を確実にするために、従来のCRNNモデルとSTAR-Netで実験を行います。さまざまなスクリプトでの変更の影響を調べるために、最初にUnicodeフォントを使用してレンダリングされた合成単語画像で実験を実行します。英語モデルをインド言語の単純な合成データセットに転送することは実用的ではないことを示します。代わりに、n-gram分布と母音や結合文字などの視覚的特徴が類似しているため、インドの言語
正確な鉄道の位置は、安全監視のための鉄道支援運転システムの重要な部分です。 LiDARは、特に暗闇やひどい気象条件で、鉄道環境の3D情報を運ぶ点群を取得できます。本論文では、点群の無秩序、不均一な密度、大量の量などの課題を解決するために、3D点群に基づくリアルタイムのレール認識方法を提案した。ボクセルダウンサンプリング法は、鉄道の点群の密度バランスをとるために最初に提示され、ピラミッドパーティションは、3Dスキャン領域を異なるボリュームのボクセルに分割するように設計されています。次に、特徴エンコーディングモジュールを開発して、最も近い隣接点を見つけ、中心点の局所的な幾何学的特徴を集約します。最後に、マルチスケールニューラルネットワークを提案して、各ボクセルとレール位置の予測結果を生成します。実験は、鉄道の3D点群データの9つのシーケンスの下で実行されます。結果は、この方法が直線、曲線、およ
Pseudo-labelling and Meta Reweighting Learning for Image Aesthetic Quality Assessment 画像の美的品質評価のタスクでは、美的データセットの正規分布のため、高スコア領域と低スコア領域の両方に到達することは困難です。ラベル付けのエラーを減らし、通常のデータ分布の問題を解決するために、AMD-CRと呼ばれる分類と回帰を使用した新しい美的混合データセットを提案し、トレーニングデータの損失を異なる方法で再重み付けするメタ再重み付けネットワークをトレーニングします。さらに、二項分類タスクの疑似ラベルに基づいて、さまざまな段階に応じたトレーニング戦略を提供し、分類および回帰タスクのさまざまな段階に応じた美的トレーニングに使用します。ネットワーク構造の構築では、入力画像の任意のサイズに適応できる美的適応ブロック(AAB)構
Video Coding for Machines: Partial transmission of SIFT features この論文は、人間と機械によるデコードされたビデオの消費に関連するビデオコーディングの新しいパラダイムである機械のビデオコーディングを扱っています。このようなタスクでは、圧縮されたビデオと機能の共同送信が考慮されます。このホワイトペーパーでは、機能の考慮事項をSIFTキーポイントに焦点を当てます。それらは、元のビデオから抽出されたSIFTキーポイントと比較して、キーポイントの数とそのパラメーターが失われた状態で、デコードされたビデオから抽出できます。このような損失は、量子化パラメータとビットレートの関数としてHEVCとVVCについて調査されます。本論文では、残余特徴データを圧縮ビデオと一緒に送信することを提案する。したがって、強く圧縮されたビデオの場合でも、すべて
FlexHDR: Modelling Alignment and Exposure Uncertainties for Flexible HDR Imaging ハイダイナミックレンジ(HDR)イメージングは、最新のデジタル写真パイプラインで基本的に重要であり、画像全体の照明が変化しても、露出の良い領域で高品質の写真を作成するために使用されます。これは通常、異なる露出で撮影された複数の低ダイナミックレンジ(LDR)画像をマージすることによって実現されます。ただし、露出過度の領域と、補正が不十分なモーションによるミスアライメントエラーは、ゴースティングなどのアーティファクトを引き起こします。この論文では、高品質のHDR結果を生成するために、アライメントと露出の不確実性を具体的にモデル化する新しいHDRイメージング技術を紹介します。フレームを単一の高品質HDR画像に堅牢にマージする、HDR対応
Microdosing: Knowledge Distillation for GAN based Compression 最近、学習した画像とビデオの圧縮に大きな進歩が見られました。特に、Generative Adversarial Networksの使用は、低ビットレート体制で印象的な結果をもたらしました。ただし、モデルサイズは、現在の最先端の提案では依然として重要な問題であり、既存のソリューションでは、デコード側でかなりの計算作業が必要です。これにより、現実的なシナリオでの使用とビデオ圧縮への拡張が制限されます。このホワイトペーパーでは、知識の蒸留を活用して、元のパラメータ数の何分の1かで同等の機能を備えた画像デコーダを取得する方法を示します。画像コーディングのサイド情報を使用したシーケンスの特殊化など、ソリューションのいくつかの側面を調査します。最後に、得られた利点をビデオ圧縮の設
Two Methods for Iso-Surface Extraction from Volumetric Data and Their Comparison 体積データから等表面を抽出するには、さまざまな方法があります。マーチングキューブ法、四面体法、レイトレーシング法が主に使用されます。計算速度を上げ、メモリ要件を減らすための多くの特定の手法があります。等値面抽出の精度も非常に重要ですが、通常は言及されていません。選択した方法の比較は、等値面抽出プロセス時間、生成された三角形の数、球の近似に基づく半径、面積、および体積の誤差の推定など、さまざまな側面で行われました。驚くべきことに、実験により、抽出された精度と抽出された等値面の人間の知覚との間に直接的な関係がないことが証明されました There are various methods for extracting iso-surfac
教師なし学習、識別、および生のピクセルからの潜在マルコフ状態空間モデルのフィルタリングのための新しい方法である変分状態空間フィルター(VSSF)を紹介します。異種センサー構成の下での潜在状態空間推論のための理論的に健全なフレームワークを提示します。結果として得られるモデルは、トレーニング中に使用されるセンサー測定値の任意のサブセットを統合できるため、半教師あり状態表現の学習が可能になり、学習された潜在状態空間の特定のコンポーネントが解釈可能な測定値と一致するようになります。このフレームワークから、線形潜在ダイナミクスとガウス分布パラメーター化を使用したこのモデルの明示的なインスタンス化であるL-VSSFを導出します。いくつかの異なるテスト環境にわたって、トレーニングデータセットのシーケンス長を超えて潜在空間でフィルタリングするL-VSSFの機能を実験的に示します。 We introduce
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く