基本的なビデオテキストモデルを確立するための効率的なアプローチを探ります。事前トレーニング済みの画像テキスト コントラスト キャプション (CoCa) モデルを最大限に再利用し、最小限の追加トレーニン

arxiv_readerarxiv_reader のブックマーク 2023/03/17 11:25

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

VideoCoCa: 対照的なキャプショナーからのゼロ ショット転送によるビデオ テキスト モデリング

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう