“同じ行/列の位置エンコーディング同士は似た値になるように学習されている”画像で画像検索するときに使えそう

millfimillfi のブックマーク 2020/10/13 13:10

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

    0. 忙しい方へ 完全に畳み込みとさようならしてSoTA達成したよ Vision Transformerの重要なことは次の3つだよ 画像パッチを単語のように扱うよ アーキテクチャはTransformerのエンコーダー部分だよ 巨大なデータ...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう