タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

RAGに関するyamada_kのブックマーク (6)

  • RAGの「業界特化」戦略(メルカリの成功例に学ぶ)

    記事では、RAGの精度を向上させるための「ドメイン特化埋め込みモデル」の手法について、ざっくり解説します。 株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何 この記事は、メルカリの研究チームがAAAI 2026で発表した「ドメイン認識型テキスト埋め込み」に関する論文[1]について、日語で簡単にまとめたものです。 ちなみに、この論文自体はRAGについて直接言及したものではありません。しかし、 RAGとは検索エンジンそのものです。一般的な検索技術の精度向上手法は、そのままRAGに使えることも多いです。 今回は特に、「一般的なベクトル検索だけでは、業界用語・日語データをうまく検索できない」 という、RAGで「あるある」な課題に対する、強力な解決策が示されています。 今回も「そもそもRAGと

    RAGの「業界特化」戦略(メルカリの成功例に学ぶ)
    yamada_k
    yamada_k 2026/01/06
  • RAGの精度が73%から100%に向上した話 ─ チャンキング戦略の比較検証

    はじめに RAG(Retrieval-Augmented Generation)システムを構築していると、「なぜか精度が上がらない」という壁にぶつかることがあります。 記事では、社内規程文書を対象としたRAGシステムで、回答精度を73.3%から100%に改善した過程を紹介します。検証した複数のチャンキング戦略の中で、意外にも最もシンプルな解決策が最も効果的だったという結果になりました。 また、「Re-rankingを導入すれば精度が上がる」と思っていたのですが、逆に精度が下がるという予想外の結果も得られました。その理由についても考察します。 プロジェクト構成 技術スタック レイヤー 技術

    RAGの精度が73%から100%に向上した話 ─ チャンキング戦略の比較検証
  • RAG実装の基本技術:「検索と参考の分離」

    記事では、RAGの性能を高めるための「SINR」という手法について、ざっくり理解します。 株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ企業向けに開発しているスタートアップです。 この記事は何 この記事は、RAGにおける「検索」と「生成のための読み込み」を分離する新手法「SINR」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は、こちらの記事もご参考下さい。 題 ざっくりサマリー 「SINR」は、RAGの回答精度を高めるための手法です。Dell Technologiesの研究チームによって2025年11月に発表されました。 ちなみに「SINR」は「Search is not Retrieval」の略です。「検索とリトリーバルは違うよ」という主張です。 通常のRAG

    RAG実装の基本技術:「検索と参考の分離」
    yamada_k
    yamada_k 2025/12/12
  • RAGやナレッジ検索アプローチの進化 生成AIによる情報検索精度が大幅アップ | AMP[アンプ] - 人生の豊かさを生む瞬間を情報でつくりだす新世代向けビジネスメディア

    生成AIの検索アプローチ、従来の「RAG」 企業での生成AI活用においては、企業独自の文脈に沿った回答を生成させることが求められる。これには、大きく2つのアプローチがある。RAG(Retrieval Augmented Generation)とファインチューニングだ。後者は若干手間のかかるアプローチである一方、より少ないリソース/ステップで、企業独自の情報を活用できるとしてRAGアプローチを採用するケースが非常に多い。 RAGとは、大規模言語モデル(LLM)による生成と、外部情報ソースを組み合わせるアプローチ。LLMが有していない企業独自の情報をモデルに与え、企業の文脈に沿った回答を生成させることが可能となる。 RAGアプローチの中核となるのが、Similarity Search(類似性検索)だ。これは、テキストデータを数値ベクトルに変換し、類似性に基づいて検索を行う手法。ユーザーの質問や

    RAGやナレッジ検索アプローチの進化 生成AIによる情報検索精度が大幅アップ | AMP[アンプ] - 人生の豊かさを生む瞬間を情報でつくりだす新世代向けビジネスメディア
    yamada_k
    yamada_k 2025/12/12
  • GraphRAGをわかりやすく解説 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 記事は日オラクルが運営する下記Meetupで発表予定の内容になります。発表までに今後、内容は予告なく変更される可能性があることをあらかじめご了承ください。 ※セミナー実施済の動画は下記です。 そもそもRAGとは 以前の記事:【ChatGPT】とベクトルデータベースによる企業内データの活用(いわゆるRAG構成)ではベクトルデータベースを利用したRAGの実装をご紹介しました。LLMが学習していないデータ(社内ドキュメントなど)をベクトルデータベースにロードし、LLMがそのデータを「参照」しながらユーザーのプロンプトに回答するシステムで、

    GraphRAGをわかりやすく解説 - Qiita
    yamada_k
    yamada_k 2025/12/12
  • RAGで非構造データを整理する手法「BookRAG」

    導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。 今回は、非構造データから構造データとナレッジグラフを構成して、質問に応じた検索手法を実行することで高い精度を実現する手法「BookRAG」を紹介します。 サマリー RAGはこれまでチャンク化した文書を検索するや、ナレッジグラフを構築して検索する手法など様々な手法が提案されて来ましたが、それぞれ苦手な検索(詳細は後述の課題意識で説明)が存在し精度に限界がありました。 「BookRAG」はツリー構造データとナレッジグラフを組み合わせたうえで、検索に利用可能な処理を11種類作成し、検索時に適切な処理を選択することで高い精度を実現できる手法となっています。 課題意識 既存手法の課題 RAGはこれまで様々な手法が提案されてきましたが、苦手な検索も存在します。 一般的なチャンク化した文書を検索するRAGでは、離れた場所の内容同士の関係性を捉える

    RAGで非構造データを整理する手法「BookRAG」
    yamada_k
    yamada_k 2025/12/12
  • 1