人間の視覚は、シーン全体から階層情報の一部全体をキャプチャすることができます。このホワイトペーパーでは、トランスフォーマーを使用してこのような階層を明示的に構築するビジュアルパーサー(ViP)について

arxiv_readerarxiv_reader のブックマーク 2021/07/14 11:22

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

ビジュアルパーサー:トランスフォーマーを使用して部分全体の階層を表す

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう