“同じ行/列の位置エンコーディング同士は似た値になるように学習されている”画像で画像検索するときに使えそう

millfi のブックマーク 2020/10/13 13:10

<blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/4692678744830859426/comment/millfi" data-user-id="millfi" data-entry-url="https://b.hatena.ne.jp/entry/s/qiita.com/omiita/items/0049ade809c4817670d7" data-original-href="https://qiita.com/omiita/items/0049ade809c4817670d7" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url=https%3A%2F%2Fqiita.com%2Fomiita%2Fitems%2F0049ade809c4817670d7" data-user-icon="/users/millfi/profile.png">画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説！ - Qiita</a><br><p style="clear: left">“同じ行/列の位置エンコーディング同士は似た値になるように学習されている”画像で画像検索するときに使えそう</p><a class="datetime" href="https://b.hatena.ne.jp/millfi/20201013#bookmark-4692678744830859426"><span class="datetime-body">2020/10/13 13:10</span></a></blockquote><script src="https://b.st-hatena.com/js/comment-widget.js" charset="utf-8" async></script>

このブックマークにはスターがありません。
最初のスターをつけてみよう！

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説！ - Qiita

qiita.com/omiita2020/10/12

0. 忙しい方へ完全に畳み込みとさようならしてSoTA達成したよ Vision Transf ormerの重要なことは次の3つだよ画像パッチを単語のように扱うよアーキテクチャはTransf ormerのエンコーダー部分だよ巨大なデータ...

436 人がブックマーク・14 件のコメント

他のコメントを読む

＼コメントがサクサク読めるアプリです／

はてなブックマーク

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説！ - Qiita

はてなブックマーク

公式Twitter

はてなのサービス