車両の数が増え続ける中、駐車場の監視と分析は現代の都市の大きな特徴になりつつあります。この研究では、駐車場を監視し、その占有率をリアルタイムで分析する方法を提示します。このソリューションは、画像分析と深層学習技術の組み合わせに基づいています。これには、パイプライン内に配置された4つのビルディングブロックが組み込まれています。車両検出、車両追跡、駐車スロットの手動注釈、およびレイトレーシングアルゴリズムを使用した占有率の推定です。この方法論の目的は、駐車場の使用を最適化し、毎日のドライバーが自分の車に適した駐車スロットを見つけるために浪費する時間を削減することです。また、駐車場のスペースをより適切に管理し、誤用事例を発見するのに役立ちます。提供されているソリューションのデモンストレーションは、次のビデオリンクに示されています:https://www.youtube.com/watch?v=K
Wave-SAN: Wavelet based Style Augmentation Network for Cross-Domain Few-Shot Learning 以前の数ショット学習(FSL)の作業は、ほとんどの場合、一般的な概念とカテゴリの自然なイメージに限定されています。これらの作品は、ソースクラスとターゲットクラスの間の視覚的な類似性が非常に高いことを前提としています。対照的に、最近提案されたクロスドメイン少数ショット学習(CD-FSL)は、多くのラベル付きの例の一般的な性質の画像から、少数のラベル付きの例のみの新しいドメイン固有のターゲットカテゴリに知識を転送することを目的としています。 CD-FSLの主な課題は、ソースドメインとターゲットドメイン間の巨大なデータシフトにあります。これは通常、まったく異なる視覚スタイルの形式です。これにより、従来のFSLメソッドを直接拡張
A deep learning pipeline for breast cancer ki-67 proliferation index scoring Ki-67増殖指数は、病理学者が適切な治療法を診断および選択するのに役立つ重要なバイオマーカーです。ただし、Ki-67の自動評価は、核の重なりや特性の複雑な変化のために困難です。この論文は、核分離技術の影響が強調されている、Ki-67の正確な自動カウントのための統合パイプラインを提案します。まず、セマンティックセグメンテーションは、SqueezおよびExcitation ResnetおよびUnetアルゴリズムを組み合わせて、バックグラウンドから核を抽出することによって実行されます。次に、抽出された核は、8つの幾何学的および統計的特徴に基づいて、重複領域と非重複領域に分割されます。続いて、マーカーベースの流域アルゴリズムが提案され、核を分離
GlideNet:マルチカテゴリ属性予測のためのグローバル、ローカル、および本質ベースの高密度埋め込みネットワーク GlideNet: Global, Local and Intrinsic based Dense Embedding NETwork for Multi-category Attributes Prediction オブジェクトカテゴリに属性(色、形、状態、アクションなど)を付けることは、コンピュータビジョンの重要な問題です。属性予測は最近エキサイティングな進歩を遂げており、マルチラベル分類問題として定式化されることがよくあります。ただし、重要な課題は次のとおりです。1)複数のカテゴリにわたる多様な属性の予測、2)属性のモデリング-カテゴリの依存関係、3)グローバルシーンとローカルシーンの両方のコンテキストのキャプチャ、4)ピクセル数の少ないオブジェクトの属性の予測。これら
動物のポーズ推定は、ライフサイエンス研究、農業、獣医学に至るまでのアプリケーションで重要です。人間のポーズ推定と比較して、動物のポーズ推定のパフォーマンスは、利用可能なデータセットのサイズとデータセット全体のモデルの一般化によって制限されます。通常、種が同じであるかどうかに関係なく、異なるキーポイントにラベルが付けられ、動物のポーズデータセットに互いに素なキーポイントまたは部分的に重複するキーポイントが残ります。結果として、モデルをデータセット全体のプラグアンドプレイソリューションとして使用することはできません。この現実は、すべてのデータセットで定義されたキーポイントを予測できるパノラマ動物ポーズ推定モデルを開発する動機になります。この作業では、差別的にラベル付けされたデータセットをマージして、最大の四足動物および実験用マウスのポーズデータセットを取得するためのシンプルで効果的な方法を提案
Generalized Rectifier Wavelet Covariance Models For Texture Synthesis テクスチャ合成の最先端の最大エントロピーモデルは、畳み込みニューラルネットワーク(CNN)によって定義された画像表現に依存する統計から構築されます。このような表現は、テクスチャ画像の豊富な構造をキャプチャし、この点でウェーブレットベースの表現よりも優れています。ただし、ニューラルネットワークとは逆に、ウェーブレットは画像内の複数のスケール(エッジなど)で構造を検出することが知られているため、意味のある表現を提供します。この作業では、一般化された整流器の非線形性を使用して、1層CNNの特定のインスタンスと見なすことができる非線形ウェーブレットベースの表現に基づいて構築された統計のファミリーを提案します。これらの統計は、以前の古典的なウェーブレットベースの
Deep Transfer Learning with Graph Neural Network for Sensor-Based Human Activity Recognition モバイルアプリケーションシナリオでのセンサーベースの人間活動認識(HAR)は、センサーモダリティの変動と注釈付きデータの不足に直面することがよくあります。この観察結果を踏まえて、センサーベースのHARタスクに向けたグラフに触発された深層学習アプローチを考案しました。これをさらに使用して、これら2つの困難な問題の暫定的な解決策を提供するための深層伝達学習モデルを構築しました。具体的には、センサーベースのHARタスク、つまりHAR-ResGCNNアプローチに向けたグラフ畳み込みニューラルネットワーク(ResGCNN)を含む多層残差構造を提示します。 PAMAP2およびmHealthデータセットの実験結果は、Re
SATr: Slice Attention with Transformer for Universal Lesion Detection コンピュータ断層撮影におけるユニバーサル病変検出(ULD)は、コンピュータ支援診断において重要な役割を果たします。有望なULDの結果は、複数の隣接するCTスライスから3Dコンテキストをモデル化するマルチスライス入力検出アプローチによって報告されていますが、このような方法では、畳み込みベースのみを使用するため、異なるスライス間および個々のスライス内でグローバル表現を取得するのが困難です。融合操作。この論文では、畳み込みベースのULDバックボーンに簡単に接続してハイブリッドネットワーク構造を形成できる新しいSlice Attention Transformer(SATr)ブロックを提案します。このような新しく形成されたハイブリッドバックボーンは、元のバック
Semi-supervision semantic segmentation with uncertainty-guided self cross supervision 半教師ありセグメンテーションを実現する強力な方法として、相互監視法は、豊富なラベルなし画像を使用して、独立したアンサンブルモデルに基づいて相互整合性を学習します。ただし、相互監視によって生成された誤った疑似ラベリング情報は、トレーニングプロセスを混乱させ、セグメンテーションモデルの有効性に悪影響を及ぼします。さらに、このような方法でのアンサンブルモデルのトレーニングプロセスは、計算リソースのコストを増大させ、トレーニング効率を低下させます。これらの問題を解決するために、我々は新しい交差監視方法、すなわち不確実性誘導自己交差監視(USCS)を提案します。アンサンブルモデルに加えて、最初に、共有モデルで複数の出力を生成できる
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く