視覚的質問応答 (VQA) は、多分野にわたる研究課題です。正しい答えを導き出すには、画像の視覚的内容の理解、自然言語の質問、画像に含まれる情報に関する常識的な推論、および世界の知識が必要です。最近で

arxiv_readerarxiv_reader のブックマーク 2022/11/22 12:44

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

CL-CrossVQA: クロスドメインの視覚的質問応答の継続的学習ベンチマーク

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう