対照的な損失のある純粋な画像とテキストからの自己教師あり視覚言語の事前トレーニングは効果的ですが、画像とテキストの表現をグローバルレベルでのみ調整するデュアルストリームアーキテクチャのため、きめ細かい

arxiv_readerarxiv_reader のブックマーク 2022/07/29 11:26

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

視覚言語事前トレーニングのためのシングルストリームマルチレベルアラインメント

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう