タグ

ブックマーク / qiita.com/fuyu_quant (2)

  • LLaVA - Qiita

    はじめに 今回はLLaVA(Large Language and Vision Assistant)の紹介になります.LLaVAは画像のエンコーダーとLLMのLlama2を合わた新しいend-to-endの学習済みモデルで,GPT4-Vのオープンソースのようなモデルです.ScienceQAというデータセットでSOTAも達成しています.日語にも対応しているみたいなので日語で検証を行っています. 記事に誤り等ありましたらご指摘いただけますと幸いです。 目次 1. LLaVA 2. 使い方 3. おわりに 4. 参考文献 1. LLaVA ライセンス:Apache-2.0 リポジトリ:https://github.com/haotian-liu/LLaVA 公式サイト:https://llava-vl.github.io/ 論文: https://arxiv.org/abs/2310.037

    LLaVA - Qiita
    tomo31415926563
    tomo31415926563 2023/11/06
    “!python -m llava.serve.cli \ --model-path liuhaotian/llava-v1.5-13b \ --image-file "/content/tokyo.jpg" \ --load-4bit”
  • ChatGPTとLangChainで便利な検索ツールを作る - Qiita

    この記事は記事投稿キャンペーン_ChatGPTの記事です。 以下は、何でもできるAIをコンセプトに個人開発したものです。 よかったら見てみてください。 CreateToolAGI:ChatGPTとLangChainで何でもできるAI はじめに こんにちは、fuyu-quantです! 今回はLangChainやllama-indexなどのOSSを使いURL vector searchという,URLを与えるだけでベクトルデータベースを作成し,質問を与えると類似している内容のURLとそのリンク先ごとに質問内容を踏まえた説明を出力してくれるツールを作成しました. まとめサイトや個人のブログなどでChatGPTを使った検索や内容の解説をさせたりする際に参考になるかと思います.実装内のプロンプトを書き換えればそれぞれのサイトにあったものが構築できると思います. 記事に誤り等ありましたらご指摘いただけま

    ChatGPTとLangChainで便利な検索ツールを作る - Qiita
  • 1