タグ

2023年10月12日のブックマーク (1件)

  • LLaVA - Qiita

    はじめに 今回はLLaVA(Large Language and Vision Assistant)の紹介になります.LLaVAは画像のエンコーダーとLLMのLlama2を合わた新しいend-to-endの学習済みモデルで,GPT4-Vのオープンソースのようなモデルです.ScienceQAというデータセットでSOTAも達成しています.日語にも対応しているみたいなので日語で検証を行っています. 記事に誤り等ありましたらご指摘いただけますと幸いです。 目次 1. LLaVA 2. 使い方 3. おわりに 4. 参考文献 1. LLaVA ライセンス:Apache-2.0 リポジトリ:https://github.com/haotian-liu/LLaVA 公式サイト:https://llava-vl.github.io/ 論文: https://arxiv.org/abs/2310.037

    LLaVA - Qiita
    katsyoshi
    katsyoshi 2023/10/12
    えっLLVMを使ったJVM実装じゃないんですか!?