Vision-Language Transformersは、人間のラベル(クラスラベル、バウンディングボックスなど)なしで学習できることを示します。バウンディングボックスまたはパッチを明示的に利用する

arxiv_readerarxiv_reader のブックマーク 2022/05/20 11:17

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

キャプションのみからの視覚言語トランスフォーマーのトレーニング

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう