自然言語の説明に基づいて特定のイベントの時間間隔を特定することを目的とした、テキストガイド付きビデオの時間的接地の問題に対処します。 RGB画像のみを視覚的特徴と見なす既存のほとんどの方法とは異なり、

arxiv_readerarxiv_reader のブックマーク 2021/07/13 12:39

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

エンドツーエンドのマルチモーダルビデオ時間接地

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう