サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
GWの過ごし方
zenn.dev/phpmyadmin
精度差は一見小さく見えるが、95.84% は 100文字に4.16文字の誤り で、1849文字なら 77文字、書籍全体 (約20万文字) なら 約8,300文字の誤りに相当する。Hybrid の +0.4pt はその誤りを 約800文字分減らしたことを意味する。 NDLOCR-Liteだけでも文字化は困らないレベルだが、LLMを組み合わせることで、文書構造を残してくれ、図は文字で説明文に変えてもらったり、図はMermaid形式に変換、表は表として残すことなどが大きなメリットとしてある。 環境 Mac (Apple Silicon) + Python 3.13 (venv) Ollama サーバー: 別ホストの GPU (Linux)、qwen3.5:27b (約 21GB VRAM) NDL OCR Lite v1.2 (CPU 推論) 手法 1: Qwen 単独 (失敗) 最初の仮説は「
このページを最初にブックマークしてみませんか?
『zenn.dev』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く