katsyoshiのブックマーク / 2023年10月12日

2023年10月12日のブックマーク (1件)

LLaVA - Qiita
はじめに今回はLLaVA(Large Language and Vision Assistant)の紹介になります．LLaVAは画像のエンコーダーとLLMのLlama2を合わた新しいend-to-endの学習済みモデルで，GPT4-Vのオープンソースのようなモデルです．ScienceQAというデータセットでSOTAも達成しています．日本語にも対応しているみたいなので日本語で検証を行っています．記事に誤り等ありましたらご指摘いただけますと幸いです。目次 1. LLaVA 2. 使い方 3. おわりに 4. 参考文献 1. LLaVA ライセンス:Apache-2.0 リポジトリ:https://github.com/haotian-liu/LLaVA 公式サイト:https://llava-vl.github.io/ 論文: https://arxiv.org/abs/2310.037
katsyoshi 2023/10/12
えっLLVMを使ったJVM実装じゃないんですか！？
リンク
- 2023年10月13日
- 2023年10月12日
- 2023年10月7日