エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
ビデオからのカスケードされた多言語オーディオビジュアル学習
この論文では、教育ビデオから学ぶ自己監視型視聴覚モデルを探求します。以前の研究では、これらのモデ... この論文では、教育ビデオから学ぶ自己監視型視聴覚モデルを探求します。以前の研究では、これらのモデルは、ビデオの大規模なデータセットでトレーニングした後、話し言葉や音を視覚的なコンテンツに関連付けることができることが示されていますが、英語のビデオでのみトレーニングおよび評価されました。多言語の視聴覚表現を学習するために、英語のビデオでトレーニングされたモデルを活用し、それを日本語のビデオなどの他の言語の視聴覚データに適用するカスケードアプローチを提案します。カスケードアプローチを使用すると、日本のビデオのみのトレーニングと比較して、検索パフォーマンスが約10倍向上することがわかります。また、英語のビデオでトレーニングされたモデルを日本語とヒンディー語の画像のキャプションに適用し、最先端のパフォーマンスを実現します。 In this paper, we explore self-supervi
2021/11/10 リンク