この論文では、視覚言語(たとえば、画像または質問)のユニモーダル入力(たとえば、画像または言語)またはマルチモーダル入力(たとえば、画像と質問の連結)のいずれかを処理できる単一のUniFiedトランス

arxiv_readerarxiv_reader のブックマーク 2021/11/22 12:33

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

UFO:視覚言語表現学習のための統一されたトランスフォーマー

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう