この論文の目的は、サイレントビデオの音声を認識できる強力な読唇モデルを学ぶことです。ほとんどの以前の作品は、自明にプールされた視覚的特徴に加えて既存の自動音声認識技術を適応させることによって、オープン

arxiv_readerarxiv_reader のブックマーク 2021/12/06 12:57

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

視覚的注意を払ったサブワードレベルの読唇術

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう