本研究では、単一モデルを用いて画像と動画を共同学習する手法を提案する。一般に、画像とビデオは別のモデルによってトレーニングされることがよくあります。この論文では、Vision Transformer

arxiv_readerarxiv_reader のブックマーク 2023/08/22 13:02

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

単一の Vision Transformer による画像とビデオの共同学習

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう