導入 これまでの連載では、構造化RAG(Structure-Aware RAG)において LlamaParseによるMarkdown整形 構造検索による検査 破綻箇所に対するVision-Guided Chunking(VGC) その上でchunk確定 という前処理パイプラインを整理してきました。 この設計は、PDFのような構造文書を扱う上で現実的かつ有効なアプローチです。 しかし、ここで立ち止まる必要があります。 私たちは一貫して「文書構造をテキストとして再構築する」ことを前提にしてきました。Markdown整形も、構造検査も、その延長線上にあります。 では、そもそも問いはこうではないでしょうか。 文書構造は、本当にテキストとして再構築すべきなのか。それとも、モデルが直接理解すべきレイヤーなのか。 VLM(Vision Language Model)が実用段階に入りつつある現在、「文書を