タグ

ocrに関するyou_gotのブックマーク (2)

  • ScanSnap S1500 の設定まとめ - 電子書籍を自炊するときの 10 のポイント - おいちゃんと呼ばれています

    これまで電子書籍を自炊するエントリーをいくつか書いてきましたが、予想以上のはてブとトラバと問合せをいただいて、嬉しい限りです。 裁断については「裁断機 PK-513L でを 100冊裁断してみた - 経験した 9つの失敗とその回避方法」でほぼ完結していますが、「スキャン → OCR テキスト認識」についても ある程度 情報が出揃ったので、この辺りで一度まとめておこうと思います。 だーかーらー、結局、ScanSnap S1500 はどう設定すれば良いわけ??時間がもったいないから手短によろしく << という声に正面から向き合ってみるエントリーです。 では、早速。 *1. 画質の選択 : スーパーファイン オススメは「スーパーファイン(カラー/グレー:300dpi、白黒:600dpi)」です。「ファイン(カラー/グレー:200dpi、白黒:400dpi)」との差は肉眼では分かりづらいですが、

  • MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介

    OCRという技術はアナログなデータをデジタル化する上で欠かすことができない。しかし様々な特許が絡み、オープンソースやフリーウェアとしては発展しづらい分野でもある。しかしそこに風穴を開けられるかも知れない技術が登場しそうだ。 デモサービスで試せます 今回紹介するオープンソース・ソフトウェアはNHocr、日語OCRシステムだ。Google Code上にホスティングされ、まだソースコードは一部しか開示されていないが、デモサービスは公開されている。 デモサービスでは、BMP/JPEG/PBM/PGM/PPMのファイル(さらに各ファイルをGZip圧縮していても可能)をアップロードすると、それを解析した結果を日語表示してくれる。日語OCRとあって、漢字/ひらがな/片仮名/英語などが判別可能になっている。 読み取らせた画像 手書き文字であっても認識率はそこそこ高い。正式リリースがまだという段階にあ

    MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介
    you_got
    you_got 2008/09/12
  • 1