タグ

ocrに関するmonjudohのブックマーク (3)

  • 画像内の文字をコピー&ペーストする

    資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。 クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。 この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを

    画像内の文字をコピー&ペーストする
    monjudoh
    monjudoh 2007/10/31
    『クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。』
  • 「CAPTCHA」技術を応用して書籍のデジタル化を進める新ツール「reCAPTCHA」

    文:Stephen Shankland(CNET News.com) 翻訳校正:大熊あつ子、吉武稔夫、長谷睦2007年05月25日 21時10分 カーネギーメロン大学のプログラマーチームが、「reCAPTCHA」というサービスを開始した。スパム防止技術を応用し、光学式文字認識(OCR)装置で書籍をデジタル化する際に認識できなかった単語を、人の力を使って読み取ろうという試みだ。 reCAPTCHAは、スパムメールやブログへのスパムコメントといったコンピュータの悪用を防ぐ目的でひろく利用されている技術、「CAPTCHA」(Completely Automated Public Turing test to tell Computers and Humans Apart:人間とコンピュータを区別するための完全に自動化された公開チューリングテスト)を発展させたものだ。この技術が適用されたサービスを

    「CAPTCHA」技術を応用して書籍のデジタル化を進める新ツール「reCAPTCHA」
  • 秋元@サイボウズラボ・プログラマー・ブログ: reCAPTCHA - キャプチャを利用した人力高性能OCR

    reCAPTCHA という新サービスはすごい。その構想力には感動させられた。 念のためにCAPTCHA(キャプチャ)について説明しておくと、スパムプログラム(bot)と人間のユーザを見分けるための簡単な(しかし機械にとっ […] reCAPTCHA という新サービスはすごい。その構想力には感動させられた。 念のためにCAPTCHA(キャプチャ)について説明しておくと、スパムプログラム(bot)と人間のユーザを見分けるための簡単な(しかし機械にとっては難しい)クイズのことだ。ある程度ウェブを使っている人なら、ネットサービスの登録時やコメントの書き込み時などに、読みにくく加工されたアルファベットを読まされたりした経験があるだろうと思う。 それらのサイトでは、あなたが人間にしかできないクイズを解いたのを見て、ユーザ登録やコメントの投稿を受け付けたりする仕組みになっているわけだ。文字を読む以外のC

    monjudoh
    monjudoh 2007/05/25
    ユーザが人間であることを確認する、崩れ画像読み取りあるじゃないすか。OCRで解読できなかった単語をこれで人間に読ませるんだそうです。
  • 1