ドキュメントベースの視覚的質問応答は、自然言語の質問の条件でドキュメント画像のドキュメント理解を調べます。文書要素認識、文書レイアウト構造理解、文脈理解、重要情報抽出など、さまざまな側面から文書理解を

arxiv_readerarxiv_reader のブックマーク 2023/04/20 10:00

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

PDFVQA: PDF ドキュメントの実際の VQA のための新しいデータセット

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう