ChromaDBは、文書の埋め込みデータを格納・管理し、文書間の類似性を効率的に検索できるデータベースです。 LangChainからも使え、以下のコードのように数行のコードでChromaDBの中にembeddingしたPDFやワードなどの文章データを格納することが出来ます。 from langchain.vectorstores import Chroma texts = text_splitter.split_documents(documents) embeddings = OpenAIEmbeddings() vectordb = Chroma.from_documents(texts, embeddings) ChromaDBはオープンソースで、Pythonベースで書かれており、FastAPIのクラスを使用することで、ChromaDBに格納されている埋め込みデータを効率的に操作し、
![【LangChain】chromadbを使ってローカルの文章(PDF・ワード)をembeddingした上で格納する](https://cdn-ak-scissors.b.st-hatena.com/image/square/5f7df41829be3b9e44f917a2d4dac1261f96ec90/height=288;version=1;width=512/https%3A%2F%2Fres.cloudinary.com%2Fzenn%2Fimage%2Fupload%2Fs--YKfWuEid--%2Fc_fit%252Cg_north_west%252Cl_text%3Anotosansjp-medium.otf_55%3A%2525E3%252580%252590LangChain%2525E3%252580%252591chromadb%2525E3%252582%252592%2525E4%2525BD%2525BF%2525E3%252581%2525A3%2525E3%252581%2525A6%2525E3%252583%2525AD%2525E3%252583%2525BC%2525E3%252582%2525AB%2525E3%252583%2525AB%2525E3%252581%2525AE%2525E6%252596%252587%2525E7%2525AB%2525A0%252528PDF%2525E3%252583%2525BB%2525E3%252583%2525AF%2525E3%252583%2525BC%2525E3%252583%252589%252529%2525E3%252582%252592embedding%2525E3%252581%252597%2525E3%252581%25259F%2525E4%2525B8%25258A%2525E3%252581%2525A7%2525E6%2525A0%2525BC%2525E7%2525B4%25258D%2525E3%252581%252599%2525E3%252582%25258B%252Cw_1010%252Cx_90%252Cy_100%2Fg_south_west%252Cl_text%3Anotosansjp-medium.otf_37%3Aseiyakitazume%252Cx_203%252Cy_121%2Fg_south_west%252Ch_90%252Cl_fetch%3AaHR0cHM6Ly9zdG9yYWdlLmdvb2dsZWFwaXMuY29tL3plbm4tdXNlci11cGxvYWQvYXZhdGFyL2I3ZjczZjRjZWUuanBlZw%3D%3D%252Cr_max%252Cw_90%252Cx_87%252Cy_95%2Fv1627283836%2Fdefault%2Fog-base-w1200-v2.png)