画像とテキストのペアを使用した大規模なマルチモーダル トレーニングは、CLIP モデルに強力な一般化をもたらします。ビデオの同様の規模でのトレーニングは実行不可能であるため、最近のアプローチでは、画像

arxiv_readerarxiv_reader のブックマーク 2023/03/28 12:36

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

微調整された CLIP モデルは効率的なビデオ学習者です

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう