タグ

ブックマーク / medium.com/@crosssceneofwindff (2)

  • GANを用いた二次元美少女全身画像生成

    IntroductionProgressiveGANやStyleGAN等、GANの発展により1024✕1024といった高解像度かつ綺麗な画像生成を行えることが可能になってきました。しかし、それらはあくまでも顔画像の生成に留まっており、以下の図のように人間の全身画像といったより複雑な画像に関しては依然として生成は難しいままです。 Koichi Hamada, et al., “ Full-body High-resolution Anime Generation with Progressive Structure-conditional Generative Adversarial Networks”そこで、今回は二次元美少女の顔画像生成という観点ではなく、全身画像に観点を置いて生成を試みたのでその結果について述べていきます。先に述べておきますが、全身と名づけておきながら実際は腰ぐらいまで

    GANを用いた二次元美少女全身画像生成
    guldeen
    guldeen 2021/03/08
    いわゆる「棒立ち」絵でも、肘を曲げるとか服飾や髪型が派手なデザインになるだけで、機械学習の成功率がガクンと下がるのは想像に難くない。それにしても、執筆当時25歳でも600万稼げますわ、この技術なら。
  • 美少女声への変換と合成

    Introduction今までは主に可愛い女の子の画像(or 動画)を生成することに取り組んできましたが、画面上に映せるようになったらやはり可愛い声で話して欲しいものです。そこで今回は、別の人の声が与えられた時に美少女声へと変換するための声質変換と、テキストが与えられた時に美少女声を生成するText-to-Speech(TTS)を行なった試行結果について述べようと思います。 Voice ConversionIntroduction声質変換のデータには2種類あります。それが、パラレルデータとノンパラレルデータです。以下にそれぞれの特徴を述べていきます。 パラレルデータを用いた声質変換 同じセリフを発する2種類の声を学習データとして用います。発話内容が同じのため、言語特徴を気にせず音響特徴量の変換を行うことが可能です。しかし、話速の違い等によって言葉を発するタイミングがずれてしまうのでDyna

    美少女声への変換と合成
    guldeen
    guldeen 2019/05/16
  • 1