エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
書籍のOCRにLLMを組み合わせることで精度を上げるだけでなく文書構造や図も表現した記録
精度差は一見小さく見えるが、95.84% は 100文字に4.16文字の誤り で、1849文字なら 77文字、書籍全体 (... 精度差は一見小さく見えるが、95.84% は 100文字に4.16文字の誤り で、1849文字なら 77文字、書籍全体 (約20万文字) なら 約8,300文字の誤りに相当する。Hybrid の +0.4pt はその誤りを 約800文字分減らしたことを意味する。 NDLOCR-Liteだけでも文字化は困らないレベルだが、LLMを組み合わせることで、文書構造を残してくれ、図は文字で説明文に変えてもらったり、図はMermaid形式に変換、表は表として残すことなどが大きなメリットとしてある。 環境 Mac (Apple Silicon) + Python 3.13 (venv) Ollama サーバー: 別ホストの GPU (Linux)、qwen3.5:27b (約 21GB VRAM) NDL OCR Lite v1.2 (CPU 推論) 手法 1: Qwen 単独 (失敗) 最初の仮説は「








2026/05/11 リンク