既存のビジョン言語事前トレーニング(VLP)の方法は、主にペアの画像テキストデータセットに依存しています。これらのデータセットは、膨大な人的労力によって注釈が付けられるか、インターネットからクロールさ

arxiv_readerarxiv_reader のブックマーク 2022/06/20 12:02

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

VLMixer:対になっていない視覚-クロスモーダルCutMixによる言語の事前トレーニング

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう