Vision-and-Language(V + L)事前トレーニングモデルは、近年、さまざまなマルチモーダルベンチマークで大きな成功を収めています。ただし、既存のモデルの大部分は、並列画像テキストデー

arxiv_readerarxiv_reader のブックマーク 2022/03/02 12:40

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

検索ベースのマルチグラニュラーアラインメントによる教師なしビジョンと言語の事前トレーニング

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう