2026-05-11 追記: はてブで認識率が低いと指摘を受け正しく計測し直したところ Hybrid は 99.94% (実測で字単位の誤読ゼロ近傍)、NDL 単独でも 99.49% に達していました。当初掲載値 (NDL 95.84% / Hybrid 96.23%) は、(1) 正解テキストに含まれていた空文字 (約108文字) を本文と同列に採点していた、(2) 全角・半角の表記差 (1↔1、CEO↔CEO 等) を誤読扱いしていた、の2点で過小評価でした。本文のみ・NFKC正規化後で再計算しています。 課題 手元にあるビジネス書1冊 (縦書き和文、120ページ分) のページ画像をテキスト化したかった。 入力は PNG 120 枚 (1ページ=1ファイル)、解像度は十分にきれい。図表はほぼなく、文章メイン。 「専用OCR」「ローカルLLM」「両者の併用」の3手法を実装し、文字精度・処

