視聴覚顕著性予測のためのViNetアーキテクチャを提案します。 ViNetは、完全に畳み込みのエンコーダ-デコーダアーキテクチャです。エンコーダーは、行動認識のために訓練されたネットワークからの視覚的

arxiv_readerarxiv_reader のブックマーク 2021/08/10 11:54

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

ViNet:視聴覚顕著性予測のための視覚モダリティの限界を押し上げる

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう