テキストから画像への合成は、特定の自然言語の説明から写実的な画像を生成することを目的としています。以前の作業は、Generative Adversarial Networks(GAN)で大きな進歩を遂げました。それでも、無傷のオブジェクトやクリアなテクスチャを生成することは依然として困難です(図1)。この問題に対処するために、機能認識生成的敵対的ネットワーク(FA-GAN)を提案し、自己監視型弁別器と機能認識損失の2つの手法を統合して高品質の画像を合成します。まず、補助デコーダーを備えた自己監視型ディスクリミネーターを設計して、ディスクリミネーターがより適切な表現を抽出できるようにします。次に、特徴認識損失を導入して、自己監視あり弁別器からの特徴表現を使用することにより、ジェネレーターにより直接的な監視を提供します。 MS-COCOデータセットでの実験は、提案された方法が最先端のFIDスコ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く