図面や書類をスキャンしてPDF形式で電子化した際、問題になってくるのは検索の問題です。 ファイル名を工夫することで、ある程度は把握できるとしても、書類の内容はファイルを開いて見なければわかりません。 数十ページに及ぶPDF書類であれば全てを確認するのは困難になりますし、データベースを利用してもスキャンしたデータの内容までは検索できません。 この問題を解決するために、OCRで処理されたテキストデータをPDFに透明なタッチアップテキストとして貼り付ける「透明テキスト付きPDF」という手法があります。 書類をスキャンした後にOCR処理し、透明なテキストをスキャンした画像に埋め込んだPDFファイルを作成します。 単純にスキャンしたPDFと違い、OCR処理をする事で、アクロバットリーダーの基本的な機能を使い中身を検索することができるようになります。 それまでの紙媒体の電子化では実現できなかった検索の
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く