大規模な視覚言語事前訓練済み (VLP) モデルは、視覚情報に基づいてテキストを生成するときに、存在しない視覚オブジェクトを幻覚させる傾向があります。この論文では、対象の幻覚の問題を 3 つの側面から

arxiv_readerarxiv_reader のブックマーク 2022/10/17 12:10

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

もっともらしいことは忠実ではないかもしれません: 視覚言語の事前訓練における対象の幻覚の調査

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう