タグ

OCRに関するsteropeのブックマーク (2)

  • クソPDF戦記 - (。・ω・。)ノ・☆':*;':*

    解析結果が書かれたPDFををplaintextに変換しようとして一週間もかかってしまってほんまクソ、ということでメモを残しておく。 そもそも何でPDFなのか? この業界、電子納品とか言ってるけど単に印刷時の出力先がプリンタドライバからPDF生成ドライバに変わった程度で印刷する人が変わっただけなのホントに闇— にょる。 (@W53SA) 2015, 9月 3 ミッション:plaintextがedocument library pdf filterとかいうウンコライブラリでPDF化された5000ページぐらいあるPDFから、100ページぐらいの表組みをplaintextに戻し、手元での解析結果とWinMergeで比較。 試した順に書いていきます。 Adobe Reader編 最初に試したのはAdobe Readerからのコピペ。 結果:「数字が一文字奥に空白が入った上に表組みが全部飛ぶ」 何が起

    クソPDF戦記 - (。・ω・。)ノ・☆':*;':*
  • デジタルペン「Denshi-Pen」の文字認識率80%を試す

    富士ゼロックスが12月9日に発売したデジタルペン「Denshi-Pen」。手書き文字の認識率が約80~90%と、通常のOCR(光学式文字読み取り)処理と比較して高い点が特徴だ。また体価格も1万479円と、他のデジタルペンよりもややお得感がある。編集部では実機を入手したので文字認識精度がいかほどか、試してみた。 デジタルペンと言えば他に、ドットパターンを印刷した専用紙を利用する「アノトペン」や、デジタルペンの軌跡を超音波と赤外線で認識する「airpen」、タブレットとデジタルペンを組み合わせた超音波検知方式の「Inkling」などがある。その中でいうとDenshi-Penはアノトペンと同じ、ドットパターンを印刷した専用用紙に手書きした文字をPC側でデジタル変換する仕組みを取っている。 Denshi-Penを使うには、ペン体と専用用紙、ソフトウェア「Denshi-Pen Studio」、U

    デジタルペン「Denshi-Pen」の文字認識率80%を試す
  • 1