タグ

ブックマーク / gyahahaha.s51.coreserver.jp (1)

  • ScanSnap S510で本を透明テキスト入りPDFに電子化 - DoldoWorkz

    メリット † 透明テキスト入りPDFとは、スキャンした際に画像をOCR(画像から文字を取り出す技術)で文字を取り出して、透明なテキストファイルとして貼り付けます。 こうする事により画像で保存するよりは以下のメリットがあります。 複数ページが1枚のファイルに収まり、サムネイルが標準で表示される。 PDF形式の利点です。 TIFF画像形式で1ファイルに複数の画像が入る形式もありますが、あまり一般的ではないのとサムネイル対応ソフトが少ないので、やはりPDFにしたほうが良いでしょう。 文字検索が出来る OCRで取り出された文字は多少誤認識する場合があるのですが、全てのページをチェックするのは不可能なのでここはあえて目をつむります。 テキストは透明で見えないようになっており、目視・印刷で見る分にはイメージ側だけが見えるので、多少誤認識しても問題ないのです。 同じ手間で、ただの画像より文

  • 1