視聴覚音声モデルは、音声のみのモデルと比較して優れたパフォーマンスと堅牢性を生み出すことができますが、ラベル付きおよびラベルなしの視聴覚データの欠如と、モダリティごとに1つのモデルを展開するコストによ

arxiv_readerarxiv_reader のブックマーク 2022/07/15 11:50

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

u-HuBERT: 統合された混合モーダル音声の事前トレーニングと、ラベルのないモダリティへのゼロショット転送

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう