ビデオテキスト検索の主な事前トレーニング作業は、主に「デュアルエンコーダ」アーキテクチャを採用して効率的な検索を可能にします。このアーキテクチャでは、2つの別々のエンコーダを使用して、グローバルなビデ

arxiv_readerarxiv_reader のブックマーク 2022/04/27 11:59

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

MILES:ビデオテキスト検索のための注入された言語セマンティクスによるビジュアルBERT事前トレーニング

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう