ViLBERTやUNITERなどの大規模な事前トレーニング済みマルチモーダルトランスフォーマーは、視覚と言語(V + L)の研究における最先端技術を新しいレベルに推進しました。標準的なタスクで印象的な

arxiv_readerarxiv_reader のブックマーク 2020/12/17 12:18

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

視覚と言語の事前トレーニング済みモデルの堅牢性を詳しく見る

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう