[B! RAG] ssmtkmtのブックマーク

RAGの検索精度を上げる新しいリランキング手法

本記事では、RAGの性能を高めるための「REBEL」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何この記事は、RAGの新手法である「REBEL」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー REBEL (RErank BEyond reLevance) は、RAGの精度を上げるための新しい手法です。MicrosoftとScale AIの研究者らによって2025年3月に提案されました。通常のRAGでは、リランキングという手法がよく使われます。これは何かというと、ベクトル検索で取ってきた文書を「ユーザーの質問との関連性」で並び替え、上位のX件をLLM

ssmtkmt 2025/04/22

RAG
LLM

リンク

【翻訳】Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 2025/2/4 に出た "Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG"(Agentic RAGの調査) v3 を訳したものです。原文はこちら概要大規模言語モデル(LLM)は、人間のようなテキスト生成と自然言語理解を可能にすることで、人工知能(AI)を革新しました。しかし、静的な訓練データに依存しているため、動的で実時間のクエリに応答する能力が限られ、出力が時代遅れや不正確になる可能性があります。RAG は、この問題の解決策として登場し、LLM に

ssmtkmt 2025/02/17

RAG
LLM

リンク

RAGで「AIエージェント」を使う手法まとめ

本記事では、RAGの性能を高めるための「Agentic RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何この記事は、「AIエージェント」をRAGに取り入れた手法である「Agentic RAG」のサーベイ論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。本題ざっくりサマリー Agentic RAG は、RAGの新しい手法です。この論文では、「RAGにAIエージェントを使っている」とはどういう状態なのか、どんなパターンがあるのかまとめられています。クリーブランド・ステート大学の研究者らによって、2025年1月に発表された論文です。最近、「AIエージェント」が注目されてい

ssmtkmt 2025/02/01

LLM
RAG

リンク

RAG技術の現状考察と2025年のトレンド予想

本記事では、現在流行している「RAG」技術について、2024年トレンドの振り返りと、2025年の予想をします。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。この記事は何 2024年は、RAGが大流行した年でした。この記事では、2024年の技術トレンドを振り返りつつ、2025年のRAGの進展を予想したいと思います。技術的トレンドはもちろん、普段、企業向けにRAGを提供している会社としての、僕の肌感覚も合わせて、お伝えできればと思います。本題ざっくりサマリー結論として、RAGは、来年も変わらず流行し続けると予想します。まず来年は、これまで以上に回答精度が向上するのは間違いないです。その理由は、LLMの価格低下トレンドと入力できるコンテキスト増大トレンドが、まだ続くためです。加えて、LLMが「視覚・音声」の入力手段を獲得したこと、ベクトルD

ssmtkmt 2024/12/25

RAG
LLM

リンク

LLMプロダクト開発で学んだLLMエージェント設計原則

こんにちは。PharmaXの上野（@ueeeeniki）です。 PharmaXでは、YOJOというサービスで複数のLLMエージェントを組み合わせたマルチエージェントの構成でチャットボットシステムを構築しています。本日は、そんなPharmaXのLLMプロダクト開発で学んだエージェント設計の原則をまとめてみたいと思います。これまでLLMプロダクト開発に関する知見を様々なところで公開してきました。 YOJOのマルチエージェントの仕組みは下記の記事をご覧いただければと思います。 LLMアプリケーションのアーキテクチャについてまとめた資料もあります。このあたりで、エージェントの設計のコツを一度まとめて置こうという意図です。 LLMエージェント設計原則まとめ PharmaXで培ったLLMエージェントの設計原則をまとめると以下のようになります。 RAGは本当に必要な時のみ使うエージェントがこなす

ssmtkmt 2024/11/27

LLM
RAG

リンク

RAGはどのように進化しているのか？RAGのパラダイムと改善手法を体系的にご紹介！ | SIOS Tech. Lab

生成AIの分野でもRAGは特に注目を集めており急成長している分野です。あまりに多くの情報に溢れており、各手法をどう捉えてよいか分かりにくい状況にあります。このブログではRAGがどのように成長し、どのような改善が試みられているのかを整理して、包括的で体系的に理解できるような説明を試みました。読んでいただいた方の理解の助けになれば幸いです。 RAGの概要 LLMは非常に優れた効果を発揮したものの、嘘を答えてしまうハルシネーションや古い知識での応答、回答の根拠の分からない不明瞭な推論といった問題を抱えています。RAGはこれらの課題に対し外部データベースを取り入れるというアプローチで解決を試みており、特に注目を集めている分野であり急速に進化しています。また、外部データベースを取り入れるという特性からドメイン固有の知識とLLMを組み合わせることができるため、企業からも大きな注目をされており研究・開発

ssmtkmt 2024/11/15

RAG
LLM

リンク

サクッと始めるRAG開発【LangChain / Python】

この本では、初心者・入門者の方に向けて、RAGの知識や使い方を体系的にまとめました。少し難易度の高い内容になりますが、本書の中で事前に学んでおくべき項目を示しているため、ご安心ください。【概要】・内容：RAGの概要【入門者向けの基礎知識】、RAGの処理フロー【In-Context Learning / Embedding / Vector Search】、RAGのビジネス活用ロードマップ【大企業向け】、RAGの実装アプローチ、RAGの大分類【Document RAG】、RAGの大分類【SQL RAG】、RAGの大分類【Graph RAG】、RAGの精度評価アプローチ、RAGの精度評価方法【LangChain Evaluation】、RAGの精度評価方法【Ragas】、RAGの精度改善手法【データ品質 / プロンプト品質 / ベクトル検索】、RAGの精度改善のためのLLMOps概論、LL

ssmtkmt 2024/10/14

RAG
LLM

リンク

An Introduction to Search and Recommender Systems for Product Manager

ssmtkmt 2024/10/11

リンク

GraphRAGを使った生成AIチャットアプリを作ってみた - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? RAGの精度向上に有効な施策としてGraphRAGという手法があります。インプットされた文章をノードとエッジと呼ばれる要素に分解し、ノード間の関係性をグラフデータとして表現する手法になります。例えば文章中に出てくる人物をノードとし、人物間の関係性をエッジで表現する、といったイメージです。ベクトル検索を使ったRAGの場合「ドキュメント内の離れた箇所に登場するけれども、関係性の強い情報」といったものを扱う際に課題がありました。 GraphRAGの活用により、そういった情報を関連のある情報として拾えるようになり、生成AIによる文脈理解の

ssmtkmt 2024/10/07

RAG
LLM

リンク

ナレッジグラフとLLMを活用したレコメンドシステム - Insight Edge Tech Blog

イントロダクション：スーパーマーケットの3つの課題ナレッジグラフとはナレッジグラフの活用事例 Google検索 Amazon ECサイトのレコメンドシステムCOSMO ナレッジグラフに関連した論文 Yu et al., COSMO: A large-scale e-commerce common sense knowledge generation and serving system at Amazon[4] Shi et al., LLM-Powered Explanations: Unraveling Recommendations Through Subgraph Reasoning[1] Wang et al., Multi-level recommendation reasoning over knowledge graphs with reinforcement lear

ssmtkmt 2024/09/30

LLM
RAG

リンク

RAG-LLMシステムへのユーザークエリは4つのレベルに分類できる最も複雑なのは「隠れた根拠からの推論が必要なクエリ」Microsoftによる研究 | AIDB

背景 LLMをそのまま使うだけでは、特定の分野や最新の情報に対応することが難しい場合があります。そこで登場したのが、外部データを活用してLLMの能力を強化する手法です。外部データを活用すると、根拠のない情報を生成してしまう「ハルシネーション」と呼ばれる問題も減らすことができます。外部データを活用する手法には、主に2つの方法があります。1つは「検索拡張生成（RAG）」で、質問に応じて関連する情報を検索し、それをLLMに与えて回答を生成します。もう1つは「ファインチューニング」と呼ばれる方法で、特定の分野のデータを使ってLLMを追加学習させます。どちらの手法も非常に効果的ですが、実際に使いこなすのは簡単ではありません。例えば、法律や医療、製造業など、専門性の高い分野で使う場合、適切なデータの選び方や、LLMの推論能力を最大限に引き出す方法など、さまざまな課題があります。また、質問の種類

ssmtkmt 2024/09/28

RAG
LLM

リンク

RAG の精度を向上させる Advanced RAG on AWS の道標 | Amazon Web Services

Amazon Web Services ブログ RAG の精度を向上させる Advanced RAG on AWS の道標生成 AI の進化と共に、大規模言語モデル (LLM) を活用したアプリケーション開発が急速に広がっています。その中で、検索拡張生成 (Retrieval-Augmented Generation; RAG) は、LLM に対して最新の情報や特定のドメイン知識を組み込むための重要な技術として注目を集めています。 RAG は、その名の通り、外部知識ベースから関連情報を検索し、それを LLM の入力に組み込むことで、より正確で最新の情報に基づいた回答を生成する手法です。この手法には以下のような重要な利点があります。最新情報の反映: LLM の学習データの制限を超えて、最新の情報を回答に反映させることができる。ドメイン特化: 特定の分野や組織固有の情報を容易に組み込むこ

ssmtkmt 2024/09/25

RAG
LLM

リンク

RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う

株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。本記事では、RAGの性能を高めるための「HybridRAG」という手法について、ざっくり理解します。この記事は何この記事は、RAGシステムを専門用語に強くするための手法「HybridRAG」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー HybridRAGは、通常のRAG（Retrieval Augmented Generation）で用いられる「ベクトル検索」の弱みを補い、回答精度を向上するための手法です。BlackRockとNVIDIAの研究者らによって2024年8月に提案されました。ベクトル検索の弱みはいくつかあります

ssmtkmt 2024/09/04

RAG
LLM

リンク

ソースコードをリポジトリ丸ごとLLMに読んでもらう方法

はじめにソースコードをLLMに読んでもらうとき、単一ファイルだと楽なのですが、GitHubのリポジトリのように複数ファイルから構成されるプロジェクトだと困ってしまいますね。リポジトリごとLLMに読んでもらえるようにいい感じにテキスト化できると良いですね。そんなソフトがありました。しかも2つ。両方ともほとんどコンセプトは同じです。特に後者のgenerate-project-summaryは使い方も含めて、自分のやりたいことが、すでに開発者の清水れみおさんが以下の記事にまとめていました。なので、あんまり書く必要ないのですが、せっかくなのでgpt-repository-loaderの使い方と、出力したファイルの別の活用方法について書いてみたいと思います。 gpt-repository-loaderでリポジトリをテキストに変換使い方はREADMEに書いてあります。シンプルなソフトなので、

ssmtkmt 2024/08/31

LLM
RAG

リンク

話題のGraphRAGとは - 内部構造の解析と実用性の考察

初めまして。経営企画本部AI推進室の鏡味、窪田、小林と申します。当社は本年度、AI推進室という新組織を発足させ、主に生成AIについての社内の利用促進、およびユーザーへ生成AIを活用したソリューションの提供を進めるべく、新技術の展開や検証を行っています。今回は、最近話題となっている、Microsoftが発表したRAG（Retrieval Augmented Generation）技術であるGraphRAG ⧉について、元となる論文やブログ記事、GitHubのコードを元に内部の構造を解析し、さらに現時点でどの程度実用的かを考察していきます。 GraphRAGとは GraphRAGは、ナレッジグラフと生成AIの技術を組み合わせることで、従来のRAGでは対応が難しかった問い合わせに回答できるようになったRAGです。2024年2月にMicrosoftによって発表 ⧉され、その後、2024年7月にリ

ssmtkmt 2024/08/21

RAG
LLM

リンク

RAG入門: 精度改善のための手法28選 - Qiita

RAGの精度改善するために何があるかを学びました。基本系のNaive RAGを知っている人向けの記事です。方法が多すぎるので、Youtubeの「RAG From Scratch」を中心に少し整理してみました。LangChainをよく使っているので、LangChain出典が多いです。全体像まずは、RAGの全体像。Indexingが同じ流れにあるのが少しわかりにくいのですが、実行タイミングとしてはRAGの前準備としてやっておきます。画像出典: RAG from scratch: Overview もう少し粒度を細かくした図です。画像出典: RAG from scratch: Overview 表形式で分類します。Generationだけ少し特殊です。大分類中分類内容

ssmtkmt 2024/08/09

RAG
LLM

リンク

実務におけるRAG 〜学びと現場のノウハウ〜 | ドクセル

スライド概要実務においてRAG（Retrieval-Augumented Generation）をたっぷり経験したhoxo-mの学びと現場のノウハウをまとめた

ssmtkmt 2024/07/23

RAG
LLM

リンク

RAG vs ファインチューニング（コーディング性能で比較）

はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。本記事では、「RAG vs ファインチューニング」について、DSL（ドメイン固有言語）をコーディングする性能という観点から比較した論文を、ざっくりまとめます。この記事は何この記事は、RAG vs ファインチューニングに関する論文[1]を、日本語で簡単にまとめたものです。「RAG vs ファインチューニング」の論文は、他にもあります。例えば、時事問題などのシンプルな知識の質疑応答であれば、RAGの方が優れています。[2] 今回の論文では、「ドメイン固有言語（DSL）をコーディングする性能」をに焦点を当てて比較しています。一見するとファインチューニングの方が有利そうなタスクについて比較しているのが面白い点です。本題ざっくりサマリーこの論文では、RAGとファインチューニングの性能比較を

ssmtkmt 2024/07/09

RAG
LLM

リンク

LLMによるナレッジグラフの作成とハイブリッド検索 + RAG

はじめに langChainはNeo4j（グラフDB）をサポートしています。今回はそちらの機能（langChain × Neo4j）を使い、ナレッジグラフの作成、検索など以下の実装を試してみます。 llmを使いテキストからグラフを生成グラフのノード情報からハイブリッド検索（全文検索とベクトル検索）を実行グラフのリレーションシップ情報からベクトル検索を実行テキストからハイブリッド検索（全文検索とベクトル検索）を実行 3つの検索（ノード、リレーションシップ、テキスト）を用いたRAG Cypherクエリをllmで生成 → 結果から回答検索したノードの周辺情報(関係するノードとリレーションシップ)を用いたRAG ナレッジグラフとはナレッジグラフは情報をグラフ構造によって表したものです（Neo4jにおける）ナレッジグラフはノード（人、場所、物などのオブジェクト）とそれらを繋ぐリレーショ

ssmtkmt 2024/07/08

LLM
RAG

リンク

RAGのSurvey論文からRAG関連技術を俯瞰する - 元生技のデータサイエンティストのメモ帳

大規模言語モデル (LLM) の学習データに含まれない知識（各社の特有の書類など）を踏まえてLLMに回答させる際に最早必須となってきたRAG (Retrieval-Augumented Generation)。今回はそんなRAGのSurvey論文を元に、RAGの変遷や構成要素、新たに出てきた技術を俯瞰していきます。 Survey論文へのリンクはこちら arxiv.org RAGとは LLMはそれ単体で回答させると、質問によってはハルシネーションや学習時のデータにはなかった情報を生成時に加味できないといった問題から正しくない回答を生成することが多々あります。例えば世間一般に公開されていない自社の就業規則や業務標準についてをChatGPTに質問しても、正しい回答は得られません。そのような問題への対応としてRAGが使われます。「LLM単体で適切な回答を生成できないなら、ユーザーの質問を元に

ssmtkmt 2024/07/04

LLM
RAG

リンク

はてなブックマーク

タグ

関連タグで絞り込む (2)

RAGに関するssmtkmtのブックマーク (23)

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第3週）

今週のはてなブックマーク数ランキング（2025年4月第2週）

今週のはてなブックマーク数ランキング（2025年4月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス