サクサク読めて、アプリ限定の機能も多数!
大規模な画像とテキストのペアで事前トレーニングされた視覚言語モデル (VLM) は、さまざまな視覚タスクで印象的な伝達可能性を示しています。このような強力な VLM から知識を伝達することは、効果的な
arxiv_reader のブックマーク 2023/03/28 12:04
事前トレーニング済みの視覚言語モデルを使用したビデオ認識のための双方向のクロスモーダル知識探索[saliency][few-shot][representation][video][dataset][pre-training][arXiv][zero-shot][arXiv reaDer][domain]大規模な画像とテキストのペアで事前トレーニングされた視覚言語モデル (VLM) は、さまざまな視覚タスクで印象的な伝達可能性を示しています。このような強力な VLM から知識を伝達することは、効果的な2023/03/28 12:04
このブックマークにはスターがありません。 最初のスターをつけてみよう!
arxiv-check-250201.firebaseapp.com2023/01/03
1 人がブックマーク・1 件のコメント
\ コメントが サクサク読める アプリです /
大規模な画像とテキストのペアで事前トレーニングされた視覚言語モデル (VLM) は、さまざまな視覚タスクで印象的な伝達可能性を示しています。このような強力な VLM から知識を伝達することは、効果的な
arxiv_reader のブックマーク 2023/03/28 12:04
このブックマークにはスターがありません。
最初のスターをつけてみよう!
事前トレーニング済みの視覚言語モデルを使用したビデオ認識のための双方向のクロスモーダル知識探索
arxiv-check-250201.firebaseapp.com2023/01/03
1 人がブックマーク・1 件のコメント
\ コメントが サクサク読める アプリです /