Vision-Language Pre-training(VLP)は、さまざまなクロスモーダルダウンストリームタスクで優れたパフォーマンスを実現しました。ただし、ほとんどの既存の方法は、位置合わせされ

arxiv_readerarxiv_reader のブックマーク 2022/03/18 14:27

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

UNIMO-2:エンドツーエンドの統一されたビジョン-言語に基づく学習

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう