michael-unltdのブックマーク - はてなブックマーク

michael-unltd id:michael-unltd

ブックマーク / zenn.dev/seiyakitazume (1)

【LangChain】chromadbを使ってローカルの文章(PDF・ワード)をembeddingした上で格納する
ChromaDBは、文書の埋め込みデータを格納・管理し、文書間の類似性を効率的に検索できるデータベースです。 LangChainからも使え、以下のコードのように数行のコードでChromaDBの中にembeddingしたPDFやワードなどの文章データを格納することが出来ます。 from langchain.vectorstores import Chroma texts = text_splitter.split_documents(documents) embeddings = OpenAI Embeddings() vectordb = Chroma.from_documents(texts, embeddings) ChromaDBはオープンソースで、Pythonベースで書かれており、FastAPIのクラスを使用することで、ChromaDBに格納されている埋め込みデータを効率的に操作し、
michael-unltd 2023/08/12
“ChromaDBは、文書の埋め込みデータを格納・管理し、文書間の類似性を効率的に検索できるデータベース”

ChromaDB
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx