dmizuno55のブックマーク - はてなブックマーク

ブックマーク / blog.shikoan.com (1)

論文まとめ：BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large
タイトル：BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models 著者：Junnan Li, Dongxu Li, Silvio Savarese, Steven Hoi（Saleforce Research）論文URL：https://arxiv.org/abs/2301.12597 コード：https://github.com/salesforce/LAVIS/tree/main/projects/blip2 HuggingFace：https://huggingface.co/spaces/taesiri/BLIP-2 ざっくりいうと視覚言語（V&L）モデルにおいて、事前学習コストを減らしつつ精度を出すための研究事前訓練済みの画像
dmizuno55 2023/05/09
AI
リンク
1

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx