import sys from pdfminer.converter import PDFPageAggregator from pdfminer.layout import LAParams, LTContainer, LTTextBox from pdfminer.pdfinterp import PDFPageInterpreter, PDFResourceManager from pdfminer.pdfpage import PDFPage def find_textboxes_recursively(layout_obj): """ 再帰的にテキストボックス(LTTextBox)を探して、テキストボックスのリストを取得する。 """ # LTTextBoxを継承するオブジェクトの場合は1要素のリストを返す。 if isinstance(layout_obj, LTTextBox