Claude3で画像が読めるようになったので、表形式を含むPDFをどのように読むのが良さそうか検証します。今回の検証には画像やグラフなどは含んでいません(画像の解析は画像で読むしか無いはず)。 非構造化doc … PDFからテキストのみを抽出して解析します。ドキュメント構造は失われています 構造化doc … PDFをHTMLに変換して解析します。ドキュメント構造は維持しています 画像 … PDFを画像に変換して解析します。ドキュメント構造は画像として読み取る事が出来るかどうか次第です LLMの性能が高いとなんでも読めちゃいそうなので、性能が高くないHaikuを使って解析します。事前の予想としては、構造化≧画像>非構造化みたいな精度を予想しています。 ちなみにAnthropicのClaudeアプリは、非構造化docとして読んでいると思います。。多分。 事前準備 何でも良いのですが以下のPDF