エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
LangChain の DocumentLoader のように HTMLファイルの一部を読み取っていくサンプル - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
LangChain の DocumentLoader のように HTMLファイルの一部を読み取っていくサンプル - Qiita
概要 LLM で RAG などをしたいため、HTML ファイルを読み取りベクトルデータベースに保存したい LangCha... 概要 LLM で RAG などをしたいため、HTML ファイルを読み取りベクトルデータベースに保存したい LangChain で HTML の DocumentLoader が使えるが、HTML の一部を抽出することができない https://python.langchain.com/docs/modules/data_connection/document_loaders/html セレクタ、XPath、id 指定など 代替手段のサンプルを提供 手順 BeautifulSoup を使って HTML ファイルの一部を読み取る LangChain の Document クラスを手動で生成する サンプルスクリプト import os from pathlib import Path from bs4 import BeautifulSoup from langchain.text_splitt