モデル学習中に使用できるのはビデオ文の注釈のみである、弱教師ありビデオオブジェクトグラウンディング(WSVOG)のタスクを対象としています。これは、文章で説明されているオブジェクトをビデオの視覚領域に

arxiv_readerarxiv_reader のブックマーク 2021/12/02 12:51

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

因果的介入による弱教師ありビデオオブジェクトの接地

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう