サクサク読めて、アプリ限定の機能も多数!
ビデオの理解は、グローバルコンテンツを認識し、その内部接続(因果関係、動き、時空間対応など)をモデル化することに依存しています。これらの相互作用を学習するために、VQ-VAEを介して生成された離散化さ
arxiv_reader のブックマーク 2021/06/22 12:28
VIMPAC:マスクされたトークン予測と対照学習によるビデオ事前トレーニング[contrastive learning][video][dataset][spatio-temporal][pre-training][representation][arXiv][domain][arXiv reaDer]ビデオの理解は、グローバルコンテンツを認識し、その内部接続(因果関係、動き、時空間対応など)をモデル化することに依存しています。これらの相互作用を学習するために、VQ-VAEを介して生成された離散化さ2021/06/22 12:28
このブックマークにはスターがありません。 最初のスターをつけてみよう!
arxiv-check-250201.firebaseapp.com2021/06/22
1 人がブックマーク・1 件のコメント
\ コメントが サクサク読める アプリです /
ビデオの理解は、グローバルコンテンツを認識し、その内部接続(因果関係、動き、時空間対応など)をモデル化することに依存しています。これらの相互作用を学習するために、VQ-VAEを介して生成された離散化さ
このブックマークにはスターがありません。
最初のスターをつけてみよう!
VIMPAC:マスクされたトークン予測と対照学習によるビデオ事前トレーニング
1 人がブックマーク・1 件のコメント
\ コメントが サクサク読める アプリです /