複数の観察は、さまざまなデータ モダリティで一般的です。たとえば、3D 形状を多視点画像で表現したり、画像をさまざまなキャプションで説明したりできます。 CLIP などの既存のクロスモーダル対比表現学

arxiv_readerarxiv_reader のブックマーク 2023/03/22 10:00

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

MXM-CLR: マルチフォールド クロスモーダル表現の対照学習のための統合フレームワーク

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう