[B! BERT][face] arxiv_readerのブックマーク

arxiv_reader id:arxiv_reader

BERTとfaceに関するarxiv_readerのブックマーク (10)

https://arxiv-check-250201.firebaseapp.com/each/2407.12927v2
arxiv_reader 2024/08/02
emotion

pre-training

dataset

BERT

arXiv reaDer

action

arXiv

video

face
リンク
セマンティックテキストツーフェイスGAN-ST ^ 2FG
arxiv_reader 2023/12/14
生成的敵対的ネットワーク（GAN）を使用して生成された顔は、前例のないリアリズムに達しました。「ディープフェイク」としても知られるこれらの顔は、ピクセルレベルの歪みがほとんどないリアルな写真として表

GAN

arXiv reaDer

face

arXiv

embedding

BERT

identification
リンク
https://arxiv-check-250201.firebaseapp.com/each/2311.17354v1
arxiv_reader 2023/11/30
arXiv

BERT

pre-training

learning

face

dataset

human

arXiv reaDer

captioning
リンク
https://arxiv-check-250201.firebaseapp.com/each/2310.17644v1
arxiv_reader 2023/10/27
classification

domain

benchmark

arXiv reaDer

knowledge distillation

detection

BERT

computer vision

face

arXiv
リンク
Switch-BERT: 注意と入力を切り替えることによるマルチモーダルインタラクションのモデル化の学習
arxiv_reader 2023/06/27
モーダル内およびモーダル間の相互作用をモデル化する機能は、マルチモーダル機械学習の基礎です。現在の最先端モデルは通常、固定構造の深層学習モデルを採用しています。特定のタスクでは優れたパフォーマンスを

BERT

arXiv

representation learning

face

arXiv reaDer

attention
リンク
EchoCoTr: 時空間心エコー検査からの左室駆出率の推定
arxiv_reader 2022/09/12
特に心エコーなどの医用画像において、効率的な映像理解を行うためには、時空間特徴の学習が重要な課題となります。畳み込みニューラルネットワーク (CNN) と最近のビジョントランスフォーマー (ViT

face

arXiv

arXiv reaDer

estimation

learning

BERT

video

dataset

CNN

transformer
リンク
セマンティックテキストツーフェイスGAN-ST ^ 2FG
arxiv_reader 2022/08/29
生成的敵対的ネットワーク（GAN）を使用して生成された顔は、前例のないリアリズムに達しました。「ディープフェイク」としても知られるこれらの顔は、ピクセルレベルの歪みがほとんどないリアルな写真として表

face

embedding

arXiv reaDer

GAN

identification

BERT

arXiv
リンク
属性情報の埋め込みとクロスモーダル対照学習に基づくマイクロエクスプレッション認識
arxiv_reader 2022/05/31
最近、顔のマイクロエクスプレッションの認識が注目されています。マイクロエクスプレッションは、持続時間が短く、強度が低いという特徴があり、既存のマイクロエクスプレッションの数が限られている高性能分類器を

3D

embedding

face

arXiv

CNN

attention

representation

BERT

contrastive learning

arXiv reaDer
リンク
StyleGAN2を使用したテキストから顔への生成
テキストの説明から画像を合成することは、Generative Adversarial Networksの出現により、活発な研究分野になりました。ここでの主な目標は、入力された説明に沿った写真のようにリアルな画像を生成することです。 Text-to-Face生成（T2F）は、Text-to-Image生成（T2I）のサブドメインであり、顔の属性の複雑さと変化のために、より困難です。それは主に公安の領域で多くのアプリケーションを持っています。 T2Fにはいくつかのモデルがありますが、画質とセマンティックアラインメントを改善する必要があります。この研究では、入力された説明とよく一致する顔画像を生成するための新しいフレームワークを提案します。私たちのフレームワークは、高解像度の顔ジェネレーターであるStyleGAN2を利用し、T2Fでの使用の可能性を探っています。ここでは、BERT埋め込みを使用し
arxiv_reader 2022/05/26
テキストの説明から画像を合成することは、Generative Adversarial Networksの出現により、活発な研究分野になりました。ここでの主な目標は、入力された説明に沿った写真のようにリ

arXiv reaDer

synthesis

GAN

domain

face

arXiv

embedding

BERT
リンク
セマンティックテキストツーフェイスGAN-ST ^ 2FG
arxiv_reader 2021/07/23
生成的敵対的ネットワーク（GAN）を使用して生成された顔は、前例のないリアリズムに達しました。「ディープフェイク」としても知られるこれらの顔は、ピクセルレベルの歪みがほとんどないリアルな写真として表

face

BERT

GAN

identification

arXiv reaDer

embedding

arXiv
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx