視覚とテキストの間の相関関係は、ビデオ モーメント検索 (VMR) に不可欠ですが、既存の方法は、視覚的理解とテキスト理解のために個別のトレーニング前の特徴抽出器に大きく依存しています。十分な時間境界

arxiv_readerarxiv_reader のブックマーク 2023/03/02 12:20

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

一般化可能なビデオ モーメントの取得に向けて: 画像テキストの事前トレーニングへの視覚動的注入

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう