タグ

OCRに関するkbysbtmupのブックマーク (4)

  • AcrobatでOCRをする

    まず、スキャンして保存したPDFファイルを付属の「Adobe Acrobat」で開きます。もし、まだソフトをイントールしていない場合は、付属のCDを使ってインストールしてください。 次に、上部のメニューバーの「文書」→「OCRテキスト認識」→「OCRを使用してテキストを認識」をクリックしてください。 すると、下のような画面が表示されます。デフォルトの設定に変更を加える必要があるので、「編集」をクリックしてください。 ここで設定するのが、上から順に「言語」、「形式」、「圧縮レベル」です。 「言語」は、に使われている言語を選択します。英語の参考書やバイリンガルなど日語と英語が2つ使われている場合は、用途にあわせてどちらか1つの言語を選択してください。PDF内検索に使いそうな言語、文章のコピペで使いたい言語を選べば良いと思います。

  • デジタル@備忘録 - FC2 BLOG パスワード認証

    ブログ パスワード認証 閲覧するには管理人が設定した パスワードの入力が必要です。 管理人からのメッセージ 閲覧パスワード Copyright © since 1999 FC2 inc. All Rights Reserved.

  • 本を送るとスキャンして電子書籍化してくれる「BOOKSCAN」の裏側を見せてもらいました

    をそのまま送ると裁断機でバラバラにした後、スキャンしてPDFデータなどに変換してくれるという、電子書籍時代が始まっているにもかかわらず既存の出版社がノロノロしているその間隙を縫うかのようなタイミングで出現したサービス、それが「BOOKSCAN」です。その舞台裏がどうなっているのかを実際に行って取材してきました。 結論から言うと、2010年4月の設立から約7ヶ月が経過、その間に新規参入業者が山ほど出現しましたが、「BOOKSCAN」はさらなる劇的な進化を遂げて差別化に成功しており、最初の頃からは考えられないレベルに到達していました。正直、わずか7ヶ月でここまでできるのだという意味では、まるで海外のスタートアップ企業のようなスピード感と、アイディアを形にする確かな技術力を感じます。 戦慄すべきその恐るべき舞台裏の中身は以下から。BOOKSCAN(ブックスキャン) 低価格・書籍スキャンサービス

    本を送るとスキャンして電子書籍化してくれる「BOOKSCAN」の裏側を見せてもらいました
  • 名刺のユーザビリティ - Trans

    うちの会社が名刺をあまり管理できていなかったので、名刺をデータベース化するために延々とOCRで読み込む作業をたまにしています。 かっこいい名刺のデザインなんちゃらというエントリーは定期的にはてブに上がるわけですが、だいたいそういう名刺はOCRでちゃんと読み込んでくれません。でも、今はOCRで名刺を管理している人も増えているはずなので、そろそろ名刺のユーザビリティも語られるべきではないかと思うわけです[誰]。 そこで、名刺を延々とOCRで読み込ませて、その正確性をメモするという作業を繰り返した結果、名刺ユーザビリティガイドラインを公開します。 ライティング 当たり前だが、誤字脱字をしない 名刺の間違いを手書きで修正しない(電話番号が変わったからといって、二重線ひいて、新しい番号を書き足すなど) 「TEL・FAX」や「TEL&FAX」を使わない サイトURLは「org」を「orp」と認識しやす

    名刺のユーザビリティ - Trans
  • 1