視聴覚スピーカーのダイアリゼーションは、聴覚信号と視覚信号の両方を使用して、「誰がいつ話したか」を検出することを目的としています。既存の視聴覚ダイアリゼーションデータセットは、主に会議室やニューススタ

arxiv_readerarxiv_reader のブックマーク 2021/12/02 11:00

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

AVA-AVD:野生の視聴覚スピーカーのダイアリゼーション

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう