ビジョントランスフォーマーは、各画像を固定長のトークンのシーケンスに分割し、自然言語処理の単語と同じ方法でトークンを処理します。通常、トークンが多いほどパフォーマンスは向上しますが、計算コストが大幅に

arxiv_readerarxiv_reader のブックマーク 2021/12/06 12:41

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

長い画像を短くする:ビジョントランスフォーマーの適応トークン長

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう