近年、音声感情認識 (SER) が研究されており、主に音声信号をスペクトログラムに変換してから、一般的な画像で事前トレーニングされ、スペクトログラムで微調整された畳み込みニューラル ネットワークを使用

arxiv_readerarxiv_reader のブックマーク 2022/11/07 12:26

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

SPEAKER VGG CCT: Speaker Embedding と Vision Transformers によるクロスコーパス音声感情認識

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう