[B! rag] [2ページ] vine_hateのブックマーク

GitHub - langchain-ai/rag-from-scratch

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

vine_hate 2024/04/16

ra

RAG

リンク

RAG Fusionが思ってたより凄そう

こちらの記事はForget RAG, the Future is RAG-Fusionを噛み砕いて解釈したものをまとめたものになります。詳細（一次情報）が欲しい方は元の記事を読むことをお勧めします。概要 RAG Fusionは単なる「新たな手法」ではなく「革新的な手法」です。 RAG Fusionは、従来の検索技術の制約を克服し、ユーザーのクエリに対してより豊かで文脈に即した結果を生成するために、RAG、Reciprocal Rank Fusion、生成されたクエリを組み合わせた新しいシステムになっています。このシステムは、検索結果のリランキングと複数のユーザークエリ生成により、検索の正確性とユーザーの意図との一致を向上させることを目指した手法となっています。 RAGの課題 RAGにはHallucinationの軽減など、多くの利点がある一方で課題もあります。 RAG Fusion開発

vine_hate 2024/04/16

rag

RAG

リンク

⼤規模⾔語モデルの拡張（RAG）が終わったかも知れない件について

Constrained K-means Clustering (クラスタサイズの制限をしたK-means法) を調べてみた

vine_hate 2024/04/11

リンク

[PDF] Azure OpenAI Serviceによる RAG実装ガイド〜⽣成AIアプリケーションの解説と実践〜

Azure OpenAI Serviceによる RAG実装ガイド〜⽣成AIアプリケーションの解説と実践〜はじめに本書の⽬的本書の⽬的は、「シンプル」「強⼒」「すぐ動く」をモットーにした RAG アプリケーションを実装するためのガイドであり、これらか RAG を始める⼈に参考にしてもらうべく⼀筆したためました。本書では RAG のアーキテクチャのみならず「実際に動くコード」もご⽤意致しました。読者の皆様には、コードを動かしながら RAG をより深くご理解頂けることを⼀番の⽬的としております。 RAG、つまり Retrieval-Augmented Generation は、とても便利ですが、⼀⾒してその全貌を掴むのは少々難しいものがあります。そこで、このガイドでは、初⼼者の⽅々でもスムーズに RAG の世界に⼊っていただけるよう、分かりやすいサンプルコードと

vine_hate 2024/04/11

リンク

RAGの実装戦略まとめ - Qiita

それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチこちらは、性質の異なる複数の検索方式（例えばベクトル検索とキーワード検索）を組み合わせて検索精度を向上させる手法になります。各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質

vine_hate 2024/04/11

リンク

RAGでの回答精度向上のためのテクニック集（応用編-A）

はじめまして。株式会社ナレッジセンスの門脇です。普段はエンジニア兼PMとして、「社内データに基づいて回答してくれる」チャットボットをエンタープライズ企業向けに提供しています（一応、200社以上に導入実績あり）。ここで開発しているチャットボットは、ChatGPTを始めとしたLLM（Large Language Models）を活用したサービスであり、その中でもRAG（Retrieval Augmented Generative）という仕組みをガッツリ利用しています。本記事では、RAG精度向上のための知見を共有していきます。はじめにこの記事は何この記事は、LlamaIndexのAndrei氏による『A Cheat Sheet and Some Recipes For Building Advanced RAG』[1]という記事で紹介されている「RAGに関するチートシート」について、And

vine_hate 2024/04/10

RAG

リンク

RAGの新しい手法「CRAG」を3分で理解する

本記事では、最近よく聞くようになった「CRAG」についてざっくり理解します。軽めの記事です。はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。この記事は何この記事は、RAGの新手法として最近注目されている「Corrective Retrieval Augmented Generation (CRAG)」の論文[1]について、日本語で簡単にまとめたものです。「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー RAGの性能を高めるための新しい手法です。Googleなどの研究者によって2024年2月に提案されました。CRAG（日本語にすると「修正型検索拡張生成」）という手法を使うメリットは、ハルシネーション（幻覚）を減らせることです。CRAGが従来の「RAG」より

vine_hate 2024/04/09

RAG
検索

リンク

インターンでRAGシステムの検索エンジンの改善をおこないました - Uzabase for Engineers

UB Researchチームで2週間の短期インターンをしている梶川です。現在、UB ResearchではRAGシステム構築に向けた研究を行っており、社内のさまざまなデータを正確に拾い上げるための検索エンジンの開発と評価を行っています。今回、その検索エンジンに代わるモデルを用いて、実際の検索テキストで検索を実施した結果を報告します。概要近年、LLMを用いた文書生成が流行しており、その中でも外部情報を検索し、LLMに追加して生成させるRAGという技術が活用されています。RAGによって、LLMが知らない情報に対して正確な応答を返すことができ、UB Researchでもニュース記事や有価証券報告書などの情報に対してRAGを適用することを考えています。既存の検索エンジンには、国内データで学習されたBERTベースのモデルを用いていますが、今回、最新のモデルであるBGE-M3を用いて、検索を実施

vine_hate 2024/04/06

RAG
llm

リンク

Building RAG-based LLM Applications for Production

[ GitHub | Notebook | Anyscale Endpoints | Ray Docs] · 55 min read Note: Check out the new evaluation reports and cost analysis with mixtral-8x7b-instruct-v0.1 and our data flywheel workflow to continuously improve our RAG applications. In this guide, we will learn how to: 💻 Develop a retrieval augmented generation (RAG) based LLM application from scratch. 🚀 Scale the major workloads (load, ch

vine_hate 2024/04/06

リンク

はてなブックマーク

タグ

関連タグで絞り込む (19)

ragに関するvine_hateのブックマーク (29)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス