テキストの説明から画像を合成することは、Generative Adversarial Networksの出現により、活発な研究分野になりました。ここでの主な目標は、入力された説明に沿った写真のようにリアルな画像を生成することです。 Text-to-Face生成(T2F)は、Text-to-Image生成(T2I)のサブドメインであり、顔の属性の複雑さと変化のために、より困難です。それは主に公安の領域で多くのアプリケーションを持っています。 T2Fにはいくつかのモデルがありますが、画質とセマンティックアラインメントを改善する必要があります。この研究では、入力された説明とよく一致する顔画像を生成するための新しいフレームワークを提案します。私たちのフレームワークは、高解像度の顔ジェネレーターであるStyleGAN2を利用し、T2Fでの使用の可能性を探っています。ここでは、BERT埋め込みを使用し
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く