ほとんどのビデオと言語の表現学習アプローチは、テキストとビデオのペアの意味的類似性に従って、ビデオとテキストの特徴を共通の潜在空間に投影するために、CLIP などの対照的な学習を採用しています。ただし

arxiv_readerarxiv_reader のブックマーク 2022/11/22 13:57

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

コンパクトなビデオと言語表現のための期待値最大化対照学習

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう