[B! sound][wav2pix] manabouのブックマーク

manabou id:manabou

soundとwav2pixに関するmanabouのブックマーク (1)

音声から顔画像を生成するwav2pixを実行してみる（アニメ顔生成もあるよ） - Qiita
はじめに Deep Learningの世界，とりわけGenerative Adversarial Networks(GAN)は近年，飛躍的に成長しており，Text-to-Imageや声質変換，音源分離など様々な分野で研究が進んでいると思います．今回のお話は，その中でも音声から顔画像を生成するwav2pixについて，ゆるく書いていきます． Paper: WAV2PIX: SPEECH-CONDITIONED FACE GENERATION USING GENERATIVEADVERSARIAL NETWORKS ざっくり概要 https://imatge-upc.github.io/wav2pix/ 提案されているモデルは以下3つのモジュールから構成されています． Speech Encoder Generator Network Discriminator Network それぞれのモジュ
manabou 2020/05/16
wav2pix

image

audio

sound
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx