なるほど、1段目はBLIPの画像→テキストで、2段目は既存LLM(FlatT5)かませてLLMが知ってる情報も使って出力するのか～、面白い

secondlife のブックマーク 2023/07/05 08:55

<blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/4731862016695768452/comment/secondlife" data-user-id="secondlife" data-entry-url="https://b.hatena.ne.jp/entry/s/blog.shikoan.com/blip-2/" data-original-href="https://blog.shikoan.com/blip-2/" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url=https%3A%2F%2Fblog.shikoan.com%2Fblip-2%2F" data-user-icon="/users/secondlife/profile.png">論文まとめ：BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large</a><ul class="comment-tag" style="list-style: none; margin: 0px;"><li style="float: left">[<a href="https://b.hatena.ne.jp/q/LLM">LLM</a>]</li></ul><br><p style="clear: left"> なるほど、1段目はBLIPの画像→テキストで、2段目は既存LLM(FlatT5)かませてLLMが知ってる情報も使って出力するのか～、面白い</p><a class="datetime" href="https://b.hatena.ne.jp/secondlife/20230705#bookmark-4731862016695768452"><span class="datetime-body">2023/07/05 08:55</span></a></blockquote><script src="https://b.st-hatena.com/js/comment-widget.js" charset="utf-8" async></script>

このブックマークにはスターがありません。
最初のスターをつけてみよう！

論文まとめ：BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large

blog.shikoan.com2023/02/04

タイトル：BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models 著者：Junnan Li, Dongxu Li, Silvio Savarese, Steven Hoi（Saleforce Research）論文UR...

9 人がブックマーク・1 件のコメント

他のコメントを読む

＼コメントがサクサク読めるアプリです／

はてなブックマーク

論文まとめ：BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large

はてなブックマーク

公式Twitter

はてなのサービス