タグ

ocrに関するhaseharuのブックマーク (2)

  • 電子化した本に最適!Adobe Acrobat の PDF 圧縮が予想外に便利すぎて鼻血が出たwww - おいちゃんと呼ばれています

    まずは下の表を見てください。 Perlベストプラクティス 作者: Damian Conway,クイープ出版社/メーカー: オライリー・ジャパン発売日: 2006/08/24メディア: 大型購入: 11人 クリック: 153回この商品を含むブログ (155件) を見る |版 / ページ数|B5版 / 513ページ| |スキャン|白黒 600dpi /(表紙のみ)カラー 300dpi| |圧縮前のサイズ|89.2MB| |圧縮後のサイズ|28.1MB| これは前回のエントリー「ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実」で調査対象にしたPDF)を、Adobe Acrobat 9(Pro / Standard)を使って圧縮した結果です。*1 前回のエントリーでは、 ScanSnap でスキャンした後に Adobe Acrobat で OCR テキスト認識

    電子化した本に最適!Adobe Acrobat の PDF 圧縮が予想外に便利すぎて鼻血が出たwww - おいちゃんと呼ばれています
    haseharu
    haseharu 2011/09/08
    ファイルサイズ
  • 紙とデジタルの橋渡し――OCR処理で住民サービスを向上した世田谷区

    東京23区で最も人口の多い世田谷区の住民税を処理するには、120万件にものぼる関係書類の入力作業が必要だ。そして、その最大の問題は、住民税を算出するための確定申告書類や報告書などの書式やサイズがまちまちで、手入力作業が基となっていたこと。世田谷区は、これを高精度のOCRによってイメージ処理することで、大幅なコストダウンを実現。それに付随してサービス向上をも成し遂げたという。 自治体の課税課における業務の1つに、住民税の計算と通知書の送付がある。世田谷区も例外ではないが、東京23区で最大となる人口83万0103人(平成21年1月1日現在)を抱える自治体となると、その課税計算処理だけでもおよそ120万件の書類をコンピュータに入力しなければならない。しかも、課税計算の根拠となる書類は、税務署からの確定申告書類、一般の区民税の申告書類、事業者からの給与支払報告書など多岐にわたる。 この課税資料を

    紙とデジタルの橋渡し――OCR処理で住民サービスを向上した世田谷区
  • 1