タグ

PythonとRAGに関するmkusakaのブックマーク (4)

  • AIエンジニアがLangChainを推奨しない理由

    はじめに 先日、あるスタートアップがシステムを作り直すという文脈の中で「LangChain を採用」という記述があり、X で疑問を呈したところ「LangChain v1 で大幅に改善された」「批判は古い印象に基づいている」「根拠のない批判だ」という反論がありました。 では実際にソースコードを読んで確認してみよう、というのが記事の趣旨です。 私自身、2年前は LangChain をメインで使っていました。 当時は生成 AI の最適解がまだ見えておらず、各社 SDK のインターフェースも頻繁に変わっていた時代です。そんな中で LangChain のようなラッパーは、コンテキストスイッチを減らし、プロトタイプを素早く回すには一定の価値がありました。 しかし 2026 年、状況は変わっています。 各社 SDK のインターフェースは安定してきた AI がどの SDK のコードでもすぐ生成できる 実

    AIエンジニアがLangChainを推奨しない理由
    mkusaka
    mkusaka 2026/02/03
    LangChain v1はRAGで過度な抽象化と依存を持ち、Embeddingが773行・設定30個、依存数は16→34に増えるためSDK直利用を推奨します。
  • RAGの取りこぼしを減らすには? — Corrective RAG で検索ミスを“後から直す”

    はじめに ルミナイR&Dチームの栗原です。 前回の記事では、Self-RAG を題材に、 Retrieve / Generate / Critique の三段構えで LLM 自身に「検索する?」「この回答どう?」を考えさせる仕組み Reflection Tokens(<RET> や ISREL / ISSUP / ISUSE)のアイデア それを OpenAI + 既存RAG で真似する「Self-RAG もどき」実装 をざっくり整理しました。 Self-RAG の視点はどちらかというと、 モデル側に自己批評させて、 “いつ・どれだけ検索するか” を賢くする という方向でした。 一方、RAG にはもう一つ大きな問題があります。 retriever が外して 関係ない or 古いドキュメント を持ってくると… LLM はそれを「根拠」だと信じて、 もっともらしい誤答(幻覚)を増幅してしまう こ

    RAGの取りこぼしを減らすには? — Corrective RAG で検索ミスを“後から直す”
    mkusaka
    mkusaka 2026/01/08
    OpenAIと既存RAGだけで、retrieval evaluatorでCorrect・Ambiguous・Incorrectを判定し、CRAG風にルーティングするPython実装例を紹介
  • DuckDB をつかってローカルなRAGを実装する

    この記事は Ubie Advent Calendar 2025 17日目の記事です。 最近Googleが File Search API を公開しました。使い方はとても簡単で、ファイルをアップロードするだけでGeminiから参照してRAGを実現できるようになります。これまでRAGは避けては通れないけど考えることが多くて面倒だったところが、一気に解消しそうです。ただ、自分としてはRAGにあまり手を出してこなかったのでRAGの構築がどれくらい泥臭いのかを知らないなと思いました。そこで、これを機にローカルで動くRAG環境を基礎的な部分から構築してみたので、そこで得た気づきなどを共有しようと思います。 作ってみたもの 実装した主な機能は以下の通りです。RAGというと何らかの vector store や全文検索エンジンを利用するのが正攻法だと思いますが、今回は分析への利用のしやすさやその拡張性、お

    DuckDB をつかってローカルなRAGを実装する
    mkusaka
    mkusaka 2025/12/23
    DuckDBとVSS拡張でベクトル+BM25ハイブリッド検索を実装し、ローカルディレクトリ監視・自動インデックス構築やα=0.75の重み付きRRF統合を提供するRAG入門
  • RAGは検索エンジンが命!Azure AI Search初心者入門 - Qiita

    はじめに こんにちは! AI エンジニアのヤマゾーです。 近年、生成 AI の進化が目覚ましく、生成 AI を活用したシステムの開発が盛んに行われています。その中で最も有名なテクニックが RAG です。RAG というのは検索拡張生成 (Retrieval Augmented Generation) の略で、質問の関連情報を検索し、質問と関連情報をセットで入力して回答させる技術のことです。 各企業ではこの RAG システムを積極的に導入していますが、ほぼ確実に課題になるのが検索部分の精度です。そして検索精度を上げるためには検索エンジンの知識が必要不可欠です。 記事では検索エンジンの筆頭サービスである Azure AI Search を題材に、検索エンジンの基的な仕組みや検索クエリの書き方について初学者向けに解説します。 サマリ 記事の目次 1. Azure AI Search の概要

    RAGは検索エンジンが命!Azure AI Search初心者入門 - Qiita
    mkusaka
    mkusaka 2025/03/23
    RAGに必須の検索エンジン、Azure AI Searchの基礎とPythonでのクエリ作成方法を解説
  • 1