はじめに シンプルなベクトル検索から一歩踏み込んで、 階層的 RAG (Hierarchical RAG) を実装してみました。 ベクトル検索だけでは物足りないと感じる場合、精度向上の一つの選択肢になるはずです。 今回 HHKB (Happy Hacking Keyboard) の取扱説明書から、設定情報を抽出するサンプルコードを用意しています。 階層的 RAG (Hierarchical RAG) とは ドキュメントを単なるフラットなテキストの塊としてではなく、見出しや段落といった階層構造を保持しながら管理・検索する手法です。 技術スタック Python ChromaDB: ベクトルデータベース PyMuPDF4LLM: PDF を Markdown に変換する変換器 hotchpotch/japanese-reranker-tiny-v2: 検索結果を精査するためのリランカー 実装ポイ

