タグ

OCRとPDFに関するkbysbtmupのブックマーク (2)

  • AcrobatでOCRをする

    まず、スキャンして保存したPDFファイルを付属の「Adobe Acrobat」で開きます。もし、まだソフトをイントールしていない場合は、付属のCDを使ってインストールしてください。 次に、上部のメニューバーの「文書」→「OCRテキスト認識」→「OCRを使用してテキストを認識」をクリックしてください。 すると、下のような画面が表示されます。デフォルトの設定に変更を加える必要があるので、「編集」をクリックしてください。 ここで設定するのが、上から順に「言語」、「形式」、「圧縮レベル」です。 「言語」は、に使われている言語を選択します。英語の参考書やバイリンガルなど日語と英語が2つ使われている場合は、用途にあわせてどちらか1つの言語を選択してください。PDF内検索に使いそうな言語、文章のコピペで使いたい言語を選べば良いと思います。

  • 本を送るとスキャンして電子書籍化してくれる「BOOKSCAN」の裏側を見せてもらいました

    をそのまま送ると裁断機でバラバラにした後、スキャンしてPDFデータなどに変換してくれるという、電子書籍時代が始まっているにもかかわらず既存の出版社がノロノロしているその間隙を縫うかのようなタイミングで出現したサービス、それが「BOOKSCAN」です。その舞台裏がどうなっているのかを実際に行って取材してきました。 結論から言うと、2010年4月の設立から約7ヶ月が経過、その間に新規参入業者が山ほど出現しましたが、「BOOKSCAN」はさらなる劇的な進化を遂げて差別化に成功しており、最初の頃からは考えられないレベルに到達していました。正直、わずか7ヶ月でここまでできるのだという意味では、まるで海外のスタートアップ企業のようなスピード感と、アイディアを形にする確かな技術力を感じます。 戦慄すべきその恐るべき舞台裏の中身は以下から。BOOKSCAN(ブックスキャン) 低価格・書籍スキャンサービス

    本を送るとスキャンして電子書籍化してくれる「BOOKSCAN」の裏側を見せてもらいました
  • 1