このペーパーでは、アクション認識タスクのベースラインとして ViViT (Video Vision Transformer) モデル、特に Factorized Encoder バージョンに焦点を当

arxiv_readerarxiv_reader のブックマーク 2023/06/09 11:10

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

ViViT トレーニングの最適化: 動作認識の時間とメモリの削減

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう