複雑なレイアウトを持つ医療文書を対象に、複数のOCRモデルの精度を検証しました。テキスト認識精度、構造保持、欠落や誤結合の傾向を比較評価しています。実務活用を見据えたモデル選定・設計検討の参考情報として整理しました。 (GENSHI AI 鈴木貴登) 0. はじめに OCR(光学文字認識)に関する検証記事は数多く存在しますが、複雑なレイアウトを持つ文書を対象に、実務利用を想定した精度比較を行っている事例は多くありません。 例えば退院サマリーのような医療文書では、行ごとに列数が異なる、セルの幅が不均一、表と文章が混在しているといった「表に近いが、厳密な表構造ではない」レイアウトが頻繁に登場します。このような文書では、単純にテキストが読めるかどうかだけでなく、文書構造をどの程度保ったまま情報を抽出できるかが、実務活用の可否を左右します。 本記事では、こうした複雑なレイアウト文書を対象に、複数の

