タグ

ragに関するvine_hateのブックマーク (29)

  • GitHub - langchain-ai/rag-from-scratch

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - langchain-ai/rag-from-scratch
    vine_hate
    vine_hate 2024/04/16
    ra
  • RAG Fusionが思ってたより凄そう

    こちらの記事はForget RAG, the Future is RAG-Fusionを噛み砕いて解釈したものをまとめたものになります。詳細(一次情報)が欲しい方は元の記事を読むことをお勧めします。 概要 RAG Fusionは単なる「新たな手法」ではなく「革新的な手法」です。 RAG Fusionは、従来の検索技術の制約を克服し、ユーザーのクエリに対してより豊かで文脈に即した結果を生成するために、RAG、Reciprocal Rank Fusion、生成されたクエリを組み合わせた新しいシステムになっています。 このシステムは、検索結果のリランキングと複数のユーザークエリ生成により、検索の正確性とユーザーの意図との一致を向上させることを目指した手法となっています。 RAGの課題 RAGにはHallucinationの軽減など、多くの利点がある一方で課題もあります。 RAG Fusion開発

    RAG Fusionが思ってたより凄そう
    vine_hate
    vine_hate 2024/04/16
    rag
  • ⼤規模⾔語モデルの拡張(RAG)が 終わったかも知れない件について

    Constrained K-means Clustering (クラスタサイズの制限をしたK-means法) を調べてみた

    ⼤規模⾔語モデルの拡張(RAG)が 終わったかも知れない件について
  • [PDF] Azure OpenAI Serviceによる RAG実装ガイド 〜 ⽣成AIアプリケーションの解説と実践 〜

    Azure OpenAI Serviceによる RAG実装ガイド 〜 ⽣成AIアプリケーションの解説と実践 〜 はじめに 書の⽬的 書の⽬的は、 「シンプル」 「強⼒」 「すぐ動く」をモットーにした RAG ア プリケーションを実装するためのガイドであり、これらか RAG を始める⼈に 参考にしてもらうべく⼀筆したためました。書では RAG のアーキテクチャ のみならず「実際に動くコード」もご⽤意致しました。読者の皆様には、コー ドを動かしながら RAG をより深くご理解頂けることを⼀番の⽬的としており ます。 RAG、つまり Retrieval-Augmented Generation は、とても便利ですが、⼀ ⾒してその全貌を掴むのは少々難しいものがあります。 そこで、このガイドでは、初⼼者の⽅々でもスムーズに RAG の世界に⼊っ ていただけるよう、分かりやすいサンプルコードと

  • RAGの実装戦略まとめ - Qiita

    それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチ こちらは、性質の異なる複数の検索方式(例えばベクトル検索とキーワード検索)を組み合わせて検索精度を向上させる手法になります。 各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。 今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。 つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質

    RAGの実装戦略まとめ - Qiita
  • RAGでの回答精度向上のためのテクニック集(応用編-A)

    はじめまして。株式会社ナレッジセンスの門脇です。普段はエンジニアPMとして、「社内データに基づいて回答してくれる」チャットボットをエンタープライズ企業向けに提供しています(一応、200社以上に導入実績あり)。ここで開発しているチャットボットは、ChatGPTを始めとしたLLM(Large Language Models)を活用したサービスであり、その中でもRAG(Retrieval Augmented Generative)という仕組みをガッツリ利用しています。記事では、RAG精度向上のための知見を共有していきます。 はじめに この記事は何 この記事は、LlamaIndexのAndrei氏による『A Cheat Sheet and Some Recipes For Building Advanced RAG』[1]という記事で紹介されている「RAGに関するチートシート」について、And

    RAGでの回答精度向上のためのテクニック集(応用編-A)
  • RAGの新しい手法「CRAG」を3分で理解する

    記事では、最近よく聞くようになった「CRAG」についてざっくり理解します。軽めの記事です。 はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。 この記事は何 この記事は、RAGの新手法として最近注目されている「Corrective Retrieval Augmented Generation (CRAG)」の論文[1]について、日語で簡単にまとめたものです。 「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 題 ざっくりサマリー RAGの性能を高めるための新しい手法です。Googleなどの研究者によって2024年2月に提案されました。CRAG(日語にすると「修正型検索拡張生成」)という手法を使うメリットは、ハルシネーション(幻覚)を減らせることです。CRAGが従来の「RAG」より

    RAGの新しい手法「CRAG」を3分で理解する
  • インターンでRAGシステムの検索エンジンの改善をおこないました - Uzabase for Engineers

    UB Researchチームで2週間の短期インターンをしている梶川です。 現在、UB ResearchではRAGシステム構築に向けた研究を行っており、社内のさまざまなデータを正確に拾い上げるための検索エンジンの開発と評価を行っています。 今回、その検索エンジンに代わるモデルを用いて、実際の検索テキストで検索を実施した結果を報告します。 概要 近年、LLMを用いた文書生成が流行しており、その中でも外部情報を検索し、LLMに追加して生成させるRAGという技術が活用されています。RAGによって、LLMが知らない情報に対して正確な応答を返すことができ、UB Researchでもニュース記事や有価証券報告書などの情報に対してRAGを適用することを考えています。既存の検索エンジンには、国内データで学習されたBERTベースのモデルを用いていますが、今回、最新のモデルであるBGE-M3を用いて、検索を実施

    インターンでRAGシステムの検索エンジンの改善をおこないました - Uzabase for Engineers
  • Building RAG-based LLM Applications for Production

    [ GitHubNotebook | Anyscale Endpoints | Ray Docs]  · 55 min read Note: Check out the new evaluation reports and cost analysis with mixtral-8x7b-instruct-v0.1 and our data flywheel workflow to continuously improve our RAG applications. In this guide, we will learn how to: 💻 Develop a retrieval augmented generation (RAG) based LLM application from scratch. 🚀 Scale the major workloads (load, ch

    Building RAG-based LLM Applications for Production