タグ

ocrに関するmainyaaのブックマーク (9)

  • Tesseract.js | Pure Javascript OCR for 100 Languages!

    Tesseract.js is a pure Javascript port of the popular Tesseract OCR engine. This library supports more than 100 languages, automatic text orientation and script detection, a simple interface for reading paragraph, word, and character bounding boxes. Tesseract.js can run either in a browser and on a server with NodeJS. Check out the Example code and API docs on GitHub.

  • Tesseract ocr

    2. 背景  お客様からたまに、携帯カメラで文字認識したいという相 談をうける。  AR的に認識した文字に合わせた動画や3次元モデルを 表示するなどをしたい。  特定物体認識では賞品のパッケージは認識できても、 個別の製品番号まで認識できない。  製品番号まで認識出来れば、より強力なマーケティングツー ルになる というわけで、何か使えるものがないか調べてた Tesseract OCR 4. Tesseract OCRとは?  オープンソースのOCR(光学文字認識)エンジン  認識可能な言語  日語含む、30ヶ国語以上  歴史  1984年-1994年 Hewlett Packard にて研究・開発  1995年 UNLV Accuracy Testでトップ3に入る  2005年 オープンソース化  現在のスポンサーはGoogleGoogle Booksで使う

    Tesseract ocr
    mainyaa
    mainyaa 2014/05/31
    "オープンソースの文字認識ライブラリTesseract OCRに触ってみた"
  • Project Naptha

    Project Naptha highlight, copy, and translate text from any image. Project Naptha automatically applies state-of-the-art computer vision algorithms on every image you see while browsing the web. The result is a seamless and intuitive experience, where you can highlight as well as copy and paste and even edit and translate the text formerly trapped within an image. Unfortunately, your browser is no

  • Engadget | Technology News & Reviews

    Pick up the 9th-gen iPad with two years of AppleCare+ for only $298

    Engadget | Technology News & Reviews
    mainyaa
    mainyaa 2014/04/25
    うおー。すげぇ!babylonよりはるかに進化してるんだなぁ。
  • 画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」

    Warning: include_once(/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-cache-phase1.php): failed to open stream: Permission denied in /home/users/0/lolipop.jp-dp16105308/web/wp/wp-content/advanced-cache.php on line 8 Warning: include_once(): Failed opening '/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-c

    画像ファイルをメールで送るだけでOCRで読み取ってくれる「n1ne@freeOCR」
    mainyaa
    mainyaa 2010/04/05
  • 秋元@サイボウズラボ・プログラマー・ブログ: reCAPTCHA - キャプチャを利用した人力高性能OCR

    reCAPTCHA という新サービスはすごい。その構想力には感動させられた。 念のためにCAPTCHA(キャプチャ)について説明しておくと、スパムプログラム(bot)と人間のユーザを見分けるための簡単な(しかし機械にとっ […] reCAPTCHA という新サービスはすごい。その構想力には感動させられた。 念のためにCAPTCHA(キャプチャ)について説明しておくと、スパムプログラム(bot)と人間のユーザを見分けるための簡単な(しかし機械にとっては難しい)クイズのことだ。ある程度ウェブを使っている人なら、ネットサービスの登録時やコメントの書き込み時などに、読みにくく加工されたアルファベットを読まされたりした経験があるだろうと思う。 それらのサイトでは、あなたが人間にしかできないクイズを解いたのを見て、ユーザ登録やコメントの投稿を受け付けたりする仕組みになっているわけだ。文字を読む以外のC

    mainyaa
    mainyaa 2007/05/25
    Captchaで使う画像を、本から取り込んだがOCRで読み取りを失敗した画像を使い、ユーザーに、すでにわかっている単語とまだわかっていない単語の2つを読ませることで、人力OCRを実現する。すばらしい発想。
  • MOONGIFT: » Web上でOCR「WeOCR Project」:オープンソースを毎日紹介

    会議室にあるホワイトボード。印刷する仕組みがあれば良いが、そうでない場合は携帯電話のカメラで撮影していく事がある。後で見返すと会議の内容が思い出せるのは便利だが、画像データのままと言うのがいただけない。テキストデータに落とし込む仕組みはないだろうか。 スキャナなどがあれば、OCRと言う手がある。これは大抵スキャナ付属、または有料だ。だがこちらはオープンソースで提供されている。 今回紹介するオープンソース・ソフトウェアはWeOCR Project、Web上で利用できるOCRソフトウェアだ。 Web上で、と言っても実際はCGIベースで動作しているので、インタフェースとしてWebを介しているに過ぎない。だが、ブラウザベースで利用できれば便利な事も多そうだ。 利用できる画像の種類はBMPやJPEGなど。圧縮されていても利用できる。画面のスクリーンショットをアップしてみた限りでは、60~70%くらい

    MOONGIFT: » Web上でOCR「WeOCR Project」:オープンソースを毎日紹介
    mainyaa
    mainyaa 2007/05/15
    これからに期待。
  • PHPでOCRを作るためのライブラリ:phpspot開発日誌

    PHP Classes - Class: phpOCR Recognize text & objects in graphical images PHPでOCR。画像の中のテキストを解析するためのクラスライブラリらしいです。 海外で配布されているツールなので、日語は通らないと思いますが、画像の中のアルファベットをちょいっと取り出したいってときに使えるのかもしれませんね。 軽くアルゴリズムを見てみるのも楽しそう。

    mainyaa
    mainyaa 2006/02/21
    面白そう。役にはたたないけどw
  • 窓の杜 - 【NEWS】独自エンジンを搭載したフリーの日本語OCRソフト「SmartOCR Lite Edition」

    独自エンジンで画像から文字を認識し、Word/ExcelファイルやRTF/HTML/CSV/PDF形式で保存できる日語OCRソフト「SmartOCR Lite Edition」v1.0.3が、17日に公開された。Windows XP/2000に対応するフリーソフトで、現在作者のホームページからダウンロードできる。 「SmartOCR Lite Edition」は、独自のエンジンを搭載したOCRソフト。スキャナー画像やBMP/TIFF/JPEG/PNG/GIF/WMF/EMF形式のファイルから読み取った文字情報をテキスト文字列に変換してTXTファイルとして保存できるほか、元画像のレイアウトや表組みを保持したWord/ExcelファイルやRTF/HTML/CSV/PDF形式でも保存できる。また元画像にテキスト情報を埋め込み、画像を選択してテキストコピーしたり文字列検索ができる“透明テキストつ

  • 1