タグ

ブックマーク / mugicha2004.hatenadiary.org (1)

  • AcrobatのOCRエラー(その後) - Mugicha2004の日記

    スキャンした雑誌PDFファイルは300〜600ページ程度。Acrobatで一気にOCRするとエラーで スキャンした雑誌PDFファイルは300〜600ページ程度。Acrobatで一気にOCRすると「Paper Capture 認識サービスのエラーにより、ページを処理できません」エラーでアウト。 そこで、ページ分割にチャレンジ。5ページ単位、10ページ単位、1ページ単位など、さまざまなサイズに分割。それらをOCRさせることに。 以下、まとめです。 分割したPDFファイル、2,000〜3,000個をまとめてAcrobatOCRすると、やっぱりエラーは発生する。 発生するけど、エラーでAcrobatが落ちる前までのPDFファイルは、OCR化に成功している。 エラーが発生したPDFファイルは、エラー発生のページ以降がOCRナシではなく、全ページがOCRされる状態に。 エラー発生のページは、そのページ

    AcrobatのOCRエラー(その後) - Mugicha2004の日記
  • 1