制御可能な画像キャプションは、特定の領域を見る、特定のテキスト スタイルで伝えるなど、人間の目的に沿った自然言語で画像を説明することを目的とした新しいマルチモーダル トピックです。最先端のメソッドは、

arxiv_readerarxiv_reader のブックマーク 2023/07/07 11:51

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

Caption Anything: 多様なマルチモーダル コントロールによるインタラクティブな画像の説明

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう