視覚的質問応答 (VQA) におけるマルチモーダル推論は、最近急速な進歩を遂げています。ただし、ほとんどの推論モデルは、トレーニング データから学習したショートカットに大きく依存しているため、困難な現

arxiv_readerarxiv_reader のブックマーク 2022/11/22 13:34

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

VQAにおけるロバスト推論のためのクロスモーダル対照学習

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう