網膜中心窩を模倣したスパイクカメラは、スパイクを発射することにより、ピクセルごとの輝度強度の蓄積を報告できます。時間分解能の高いバイオインスパイアードビジョンセンサーとして、コンピュータービジョンに大きな可能性を秘めています。ただし、現在のスパイクカメラのサンプリングモデルは、量子化とノイズの影響を受けやすいため、オブジェクトのテクスチャの詳細を効果的にキャプチャできません。この作業では、受容野(RVSM)に触発された堅牢な視覚サンプリングモデルを提案します。ここでは、ガウス(DoG)とガウスフィルターの差によって生成されたウェーブレットフィルターを使用して受容野をシミュレートします。逆ウェーブレット変換と同様の対応する方法を使用して、RVSMからのスパイクデータを画像に変換できます。パフォーマンスをテストするために、さまざまなモーションシーンを含む高速モーションスパイクデータセット(HM
PyramidTNT:PyramidアーキテクチャによるTransformer-in-Transformerベースラインの改善 PyramidTNT: Improved Transformer-in-Transformer Baselines with Pyramid Architecture Transformerネットワークは、コンピュータービジョンタスクで大きな進歩を遂げました。 Transformer-in-Transformer(TNT)アーキテクチャは、内部トランスと外部トランスを利用して、ローカル表現とグローバル表現の両方を抽出します。この作業では、2つの高度な設計を導入することによって新しいTNTベースラインを提示します:1)ピラミッドアーキテクチャと2)畳み込みステム。新しい「PyramidTNT」は、階層表現を確立することにより、元のTNTを大幅に改善します。 Pyra
Interactive Attention AI to translate low light photos to captions for night scene understanding in women safety 画像キャプションと低照度画像エンハンスメントのディープラーニングベースのモデルには驚くべき進歩があります。この論文は、文学で初めて、夜のシーンを文章に変換するディープラーニングモデルを開発し、視覚障害のある女性の安全におけるAIアプリケーションの新しい可能性を開きます。画像キャプションと視覚的な質問応答に触発されて、新しいインタラクティブ画像キャプションが開発されました。ユーザーは、注意スコアに影響を与えることで、選択した関心のある人物にAIを集中させることができます。注意コンテキストベクトルは、CNN特徴ベクトルとユーザー提供の開始語から計算されます。 Encode
Rice Diseases Detection and Classification Using Attention Based Neural Network and Bayesian Optimization この研究では、ベイズ最適化を使用した注意ベースの深さ方向に分離可能なニューラルネットワーク(ADSNN-BO)を提案して、イネの葉の画像からイネの病気を検出および分類します。イネの病気はしばしば収穫量の20から40%の企業生産の損失をもたらし、世界経済と非常に関連しています。迅速な病気の特定は、治療を迅速に計画し、企業の損失を減らすために重要です。イネ病の診断は今でも主に手作業で行われています。 AIを利用した迅速で正確な病気の検出を実現するために、MobileNet構造と拡張された注意メカニズムに基づくADSNN-BOモデルを提案しました。さらに、ベイズ最適化法を適用して、モデル
Gaussian-Hermite Moment Invariants of General Vector Functions to Rotation-Affine Transform データ取得技術の発達により、マルチチャネルデータが収集され、多くの分野で広く使用されています。それらのほとんどは、さまざまなタイプのベクトル関数として表現できます。関心のある特定のパターンを識別するためのベクトル関数の特徴抽出は、重要ですが困難な作業です。この論文では、一般的なベクトル関数のモーメント不変量の構築に焦点を当てます。具体的には、一般的なベクトル関数の実際の変形を記述するために回転アフィン変換を定義し、この変換モデルに対してガウス-エルミートモーメント不変量を体系的に生成する構造フレームを設計します。一般的なベクトル関数の直交モーメント不変量を構築するために、文献で均一フレームが提案されたのはこれ
Local Directional Gradient Pattern: A Local Descriptor for Face Recognition この論文では、顔認識のために高階微分空間の局所パターン記述子を提案した。提案された局所方向勾配パターン(LDGP)は、4つの異なる方向で参照ピクセルの高次導関数間の関係をエンコードすることによって計算された1D局所マイクロパターンです。提案された記述子は、4つの異なる方向の参照ピクセルの高階導関数間の関係を識別して、局所的な特徴に対応するマイクロパターンを計算します。提案された記述子は、マイクロパターンの長さを大幅に短縮し、その結果、認識率を維持しながら、抽出時間とマッチング時間を短縮します。ベンチマークデータベースAT&T、Extended Yale B、およびCMU-PIEで実施された広範な実験の結果は、提案された記述子が抽出とマッチン
Local Quadruple Pattern: A Novel Descriptor for Facial Image Recognition and Retrieval この論文では、顔画像の認識と検索のために、新しい手作りのローカル4重パターン(LQPAT)を提案します。既存の手作りの記述子のほとんどは、ローカル近隣の限られた数のピクセルのみをエンコードします。制約のない環境では、これらの記述子のパフォーマンスは大幅に低下する傾向があります。ローカル近傍を増やす際の主な問題は、記述子の特徴の長さも増えることです。提案された記述子は、最適な長さの効率的なエンコーディング構造を定義することにより、これらの問題を克服しようとします。提案された記述子は、4倍の空間で隣接するもの間の関係をエンコードします。ローカル関係から2つのマイクロパターンが計算され、記述子が形成されます。提案された記述子
Automated 3D reconstruction of LoD2 and LoD1 models for all 10 million buildings of the Netherlands このホワイトペーパーでは、2DビルディングポリゴンとLiDARポイントクラウドに基づいて3Dビルディングモデルを自動的に再構築するためのワークフローを紹介します。ワークフローは、さまざまな詳細レベル(LoD)でモデルを生成し、1つの一貫したソースからさまざまなアプリケーションのデータ要件をサポートします。アルゴリズムが改善された場合、または新しい入力データが利用可能になった場合に、ワークフローを堅牢にして新しい反復をすばやく実行できるようにするために、特別な注意が払われています。再構築されたデータの品質は、入力データの品質に大きく依存し、プロセスのいくつかのステップで監視されます。 3Dビュー
Delving into Sample Loss Curve to Embrace Noisy and Imbalanced Data 破損したラベルとクラスの不均衡は、実際に収集されたトレーニングデータで一般的に発生し、ディープニューラルネットワーク(DNN)の過剰適合につながりやすくなります。既存のアプローチは、サンプル再重み付け戦略を採用することによってこれらの問題を軽減します。これは、重み付け関数を設計することによってサンプルを再重み付けすることです。ただし、いずれか1つのタイプのデータバイアスのみを含むトレーニングデータにのみ適用できます。ただし、実際には、ラベルが破損し、テールクラスの偏ったサンプルがトレーニングデータに共存するのが一般的です。それらを同時に処理する方法は重要ですが、十分に検討されていない問題です。この論文では、これら2種類のバイアスされたサンプルは、同様の過渡
空港の滑走路などの主要なインフラストラクチャの監視に適用される変更検出方法は、災害救援と都市計画のための重要な機能です。現在の作業は、もっともらしい滑走路マップと衛星画像の間で可逆的に変換する2つの生成的敵対的ネットワーク(GAN)アーキテクチャを識別します。同じ観点からペアの画像(衛星マップ)を使用し、Pix2Pixアーキテクチャまたは条件付きGANを使用してトレーニング機能を説明します。利用可能なペアがない場合も、同様に、4つのネットワークヘッドを備えたCycleGANアーキテクチャ(ディスクリミネーターとジェネレーターのペア)が、生の画像ピクセルからアウトラインまたはフィーチャマップへの効果的なスタイル転送を提供できることを示します。滑走路と滑走路の境界を強調するために、従来の灰色がかった黄褐色のマップパレットは必須のトレーニング入力ではありませんが、よりシャープな滑走路の境界のため
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く