概要 gpt-index(llama-index)で、日本語PDFを安定して読めるようにするためのプルリクがマージされたので、使い方を紹介します。 使い方 download_loaderでCJKPDFReaderをダウンロードして使います。 from gpt_index import download_loader CJKPDFReader = download_loader("CJKPDFReader") loader = CJKPDFReader() documents = loader.load_data(file='data/article.pdf') print(documents)