Transformerベースのモデルのトレーニングには大量のデータが必要ですが、マルチモダリティで整列およびラベル付けされたデータを取得することは、特にオーディオビジュアル音声認識(AVSR)の場合、

arxiv_readerarxiv_reader のブックマーク 2022/03/29 11:38

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

マルチモーダルオーディオビジュアル音声認識のためのユニモーダル自己監視学習の活用

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう