フォトリアリスティックなリライト可能なマテリアルを3D形状に自動的に割り当てる方法を紹介します。この方法では、実際のオブジェクトとセグメンテーションを使用した3Dオブジェクトの写真エグザンプラを入力として受け取り、そのエグザンプラを使用して、形状のパーツへのマテリアルの割り当てをガイドします。これにより、結果の形状の外観が可能な限り類似します。模範。この目標を達成するために、私たちの方法は、画像変換ニューラルネットワークと材料割り当てニューラルネットワークを組み合わせます。画像変換ネットワークは、色をエグザンプラから3D形状の投影に変換し、パーツのセグメンテーションを投影からエグザンプラに変換します。次に、材料予測ネットワークは、翻訳された画像と材料の知覚的類似性に基づいて、現実的な材料のコレクションから投影されたパーツに材料を割り当てます。私たちの方法の重要なアイデアの1つは、変換ネット
A Nonlocal Graph-PDE and Higher-Order Geometric Integration for Image Labeling この論文では、グラフ上のメトリックデータにラベルを付けるための新しい非局所偏微分方程式(PDE)を紹介します。 PDEは、J。〜Math。〜Imaging \&Vision 58(2)、2017で導入された割り当てフローアプローチの非局所再パラメータ化として導出されます。このパラメータ化により、PDEを数値的に解くことは、非凸ポテンシャルに関するリーマン勾配流。このポテンシャルのエントロピー正規化凸関数差(DC)分解を考案し、割り当てフローを統合するための基本的な幾何学的オイラースキームが確立されたDCプログラミングスキームによってPDEを解くことと同等であることを示します。さらに、幾何学的統合の観点から、新しい加速DCプログラミング
SoftPool++: An Encoder-Decoder Network for Point Cloud Completion 点群補完のタスクのための新しい畳み込み演算子を提案します。私たちのアプローチの顕著な特徴の1つは、関連する作業とは逆に、最大プーリングまたはボクセル化操作を必要としないことです。代わりに、エンコーダーに埋め込まれた点群を学習するために使用された提案された演算子は、特徴のアクティブ化のソフトプーリングを介して点群から順列不変の特徴を抽出します。これらの機能は、デコーダーアーキテクチャに渡されます。エンコーダーでの圧縮により、このタイプのアーキテクチャーの一般的な制限は、入力形状構造の一部を失う傾向があることです。エンコーダーとデコーダーの対応するレイヤー間のリンクが確立される、ポイントクラウド用に特別に考案されたスキップ接続を使用することにより、この制限を克服す
Iterative Geometry-Aware Cross Guidance Network for Stereo Image Inpainting 現在、単一画像の修復は、深い畳み込みニューラルネットワークに基づいて有望な結果を達成しています。ただし、領域が欠落しているステレオ画像への修復は十分に検討されていません。これも重要ですが、異なる問題です。ステレオ画像の修復の重要な要件の1つは、ステレオの一貫性です。これを実現するために、反復ジオメトリ対応クロスガイダンスネットワーク(IGGNet)を提案します。 IGGNetには、Geometry-Aware Attention(GAA)モジュールとIterative Cross Guidance(ICG)戦略という2つの重要な要素が含まれています。 GAAモジュールは、エピポーラジオメトリの手がかりに依存し、あるビューから別のビューへのジ
Unified Chinese License Plate Detection and Recognition with High Efficiency 最近、深層学習ベースの方法は、ナンバープレート(LP)の検出および認識タスクで優れたパフォーマンスに達しました。ただし、大規模で代表的なデータセットが十分にないため、中国のLPの堅牢なモデルを構築することは依然として困難です。この作業では、既存の公開ベンチマークの補足として、多目的中国のLP画像を含むChinese Road Plate Dataset(CRPD)という名前の新しいデータセットを提案します。画像は主に詳細な注釈付きの電子監視システムでキャプチャされます。私たちの知る限り、CRPDは、頂点の注釈が付いた最大のパブリック多目的中国LPデータセットです。 CRPDでは、高効率の統合された検出および認識ネットワークがベースラインと
Deep Learning-enabled Detection and Classification of Bacterial Colonies using a Thin Film Transistor (TFT) Image Sensor 大腸菌(E.coli)などの病原菌の早期発見と特定は、公衆衛生にとって不可欠な課題です。細菌コロニーを検出するための従来の培養ベースの方法は、通常、最終的な読み取り値を取得するのに24時間以上かかります。ここでは、環境保護庁(EPA)が承認した方法と比較して、約12時間節約できる薄膜トランジスタ(TFT)ベースのイメージセンサーアレイを活用した細菌コロニー形成単位(CFU)検出システムを示します。このCFU検出システムの有効性を実証するために、サンプルの視野が約10 cm ^ 2のTFTイメージセンサーを使用して、レンズフリーのイメージングモダリティが
Attract me to Buy: Advertisement Copywriting Generation with Multimodal Multi-structured Information 最近、オンラインショッピングは徐々に世界中の人々の一般的な買い物方法になりました。素晴らしい商品広告は、多くの場合、より多くの人々を購入に引き付けます。これらの広告は、視覚的な空間情報やきめ細かい構造情報など、商品のマルチモーダルマルチ構造情報を適切に統合します。ただし、従来のマルチモーダルテキスト生成は、存在および発生したものの従来の記述に焦点を合わせており、現実の世界での広告コピーライティングの要件とは一致しません。広告のコピーライティングは、鮮やかな言語スタイルと忠実さのより高い要件を持っているからです。残念ながら、再利用可能な評価フレームワークが不足しており、データセットが不足してい
Automatic segmentation of meniscus based on MAE self-supervision and point-line weak supervision paradigm ディープラーニングに基づく医療画像のセグメンテーションは、データセットが不十分で、ラベル付けに時間がかかるという問題に直面することがよくあります。この論文では、膝関節画像に自己監視方式MAE(Masked Autoencoders)を導入して、セグメンテーションモデルに適切な初期重みを提供し、モデルの小さなデータセットへの適応性を向上させます。次に、ラベリングの時間を短縮するために、ポイントとラインの組み合わせに基づくメニスカスセグメンテーションの弱く監視されたパラダイムを提案します。弱いラベルに基づいて、疑似ラベルを生成するための領域成長アルゴリズムを設計します。最後に、自己監視
Unsupervised Deep Unrolled Reconstruction Using Regularization by Denoising ディープラーニング手法は、さまざまなコンピュータービジョンタスクでうまく使用されています。その成功に触発されて、深層学習が磁気共鳴画像法(MRI)再構成で探求されてきました。特に、深層学習とモデルベースの最適化手法を統合することには、かなりの利点があります。ただし、通常、高品質の再構成には大量のラベル付きトレーニングデータが必要であり、これは一部のMRIアプリケーションでは困難です。本論文では、教師なしノイズ除去ネットワークとプラグアンドプレイ法を組み合わせることにより、MR画像再構成のための解釈可能な教師なし学習を可能にするDURED-Netという名前の新しい再構成法を提案した。イメージング物理学を利用する明示的な事前分布を追加することに
LatentKeypointGAN: Controlling Images via Latent Keypoints -- Extended Abstract 敵対的生成ネットワーク(GAN)は、写真のようにリアルな画像を生成できるようになりました。ただし、画像コンテンツを最適に制御する方法は、未解決の課題です。 LatentKeypointGANを紹介します。これは、生成されたオブジェクトとそれぞれのパーツの位置とスタイルを制御する、一連のキーポイントと関連する外観の埋め込みを内部条件とする2段階のGANです。私たちが取り組む主な困難は、ドメインの知識と監視信号がほとんどない状態で、画像を空間的要因と外観要因に解きほぐすことです。 LatentKeypointGANは、異なる画像から目と口を組み合わせてポートレートを生成するなど、キーポイントの埋め込みを再配置および交換することで、生成さ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く