“本論文ではCNN(ResNet)とViTを比較して、内部構造に驚くほど明確な違いがあることを示しました。”

misshikimisshiki のブックマーク 2022/05/16 15:33

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

なぜビジョントランスフォーマーはこれほど高性能なのか。

    3つの要点 ✔️ ViTは、すべての層でより均一な表現(特徴量)を持っている。つまり各層での表現が似ている。 ✔️ ViTは、自己注意(self-attention)により早期にグローバルな情報を集約できる。 ✔️ ViTは、表現を下位...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう