私たちは、マルチモーダル大規模言語モデル (MLLM) である Kosmos-2 を導入し、オブジェクトの説明 (境界ボックスなど) を認識し、テキストを視覚的な世界に固定する新しい機能を可能にしま

arxiv_readerarxiv_reader のブックマーク 2023/06/28 10:00

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

Kosmos-2: マルチモーダル大規模言語モデルを世界に発信する

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう