画像とテキストの検索は、視覚と言語の間の意味論的な関係を理解するための中心的な問題であり、さまざまな視覚および言語タスクの基礎として機能します。これまでの研究のほとんどは、画像とテキスト全体の粗粒表

arxiv_readerarxiv_reader のブックマーク 2023/06/16 11:59

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

一貫したマルチモーダルな対比トレーニングによる効率的なトークンガイドによる画像テキスト検索

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう