タグ

OCRに関するniidomeのブックマーク (7)

  • 機械学習×Webアプリ診断:Cloud Vision APIでCAPTCHAを認識する - Qiita

    前回は「Chainer」を使って多層パーセプトロンを実装し、CAPTCHA画像の認識を試みた。 今回はGoogleの画像分析API「Cloud Vision API」を使って同じことをやってみる。 アジェンダ 0.実装コード 1.やってみる 2.まとめ 3.参考文献 0.実装コード 今回は検証用にシンプルな画像分析用のクラスを作成した。 見て分かる通り、Cloud Vision APIで定義されたJSON形式のリクエストをPOSTするだけだ。 #!/usr/bin/python #coding:utf-8 import base64 import json from requests import Request, Session # Cloud Vision APIで画像を分析 class RecognizeImage(): def __init__(self): return # CA

    機械学習×Webアプリ診断:Cloud Vision APIでCAPTCHAを認識する - Qiita
    niidome
    niidome 2017/12/11
  • http://amazarashi.me/ocr-google-cloud-vision-api/

    http://amazarashi.me/ocr-google-cloud-vision-api/
    niidome
    niidome 2017/12/08
  • 画像ファイルをテキスト化してくれる「n1ne@freeOCR」(無料) | ライフハッカー・ジャパン

    OCRで書類を読ませるために、わざわざ一度プリントしてから、ドキュメントスキャナに...なんていう経験はないでしょうか? ブログ「Blog.IKUBON.com」で紹介されていた「n1ne@freeOCR」を使えば、そんな必要はありません。スキャナが無くても、OCRが無料で使えちゃいます。 使い方も簡単。テキスト化したいファイルを添付して、メールで送るだけなのです。 対応している拡張子は、 .bmp .dib .rle .dcx .djvu .djv. gif. jb2 .jbig2 .jp2 .j2k .jpg .jpeg .pcx .pdf .png .tif .tiff .xps と、よく見るものからそうでないモノまで、かなり豊富。 これらのファイルであれば、ocr@n1ne.netに添付して送ると、画像をテキスト化して、doc,docx,pdfのファイル形式で送り返してくれるそうで

    画像ファイルをテキスト化してくれる「n1ne@freeOCR」(無料) | ライフハッカー・ジャパン
  • 橋本商会 » scansnapと裁断機を買って本を電子化しまくる

    を解体する為にこの裁断機を買った。14000円ぐらい。 大型ペーパーカッター 裁断機 まだ必要ないので買ってないけど、替え刃も発見した。 コピー用紙500枚らくらくカット/人気 商品大型ペーパーカッター用『替え刃』 ジャンプぐらいの厚い雑誌でも切れる。このサイズの裁断機では妙に安い(他の半額程度)だが、そのかわり届いた時点で油でぬるぬるしている。 軍手とぞうきんを用意しておいて、よく拭いた。 刃の部分には茶色い油?が付着しているので、試しにいらないを裁断してみて油の拭き残しが無いか確かめる必要がある。 油がついた。(古ぐらしは新しいのを持っているので、2003年版を試し切りに使った) ■裁断する まずスキャンできるようにをバラバラにする。 表紙を外す しっかり押さえる 切る 切る。裁断機の刃が超鋭いので、あんまり力はいらない。 バラバラにしたをscansnapに入れる iPhon

    橋本商会 » scansnapと裁断機を買って本を電子化しまくる
  • MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介

    OCRという技術はアナログなデータをデジタル化する上で欠かすことができない。しかし様々な特許が絡み、オープンソースやフリーウェアとしては発展しづらい分野でもある。しかしそこに風穴を開けられるかも知れない技術が登場しそうだ。 デモサービスで試せます 今回紹介するオープンソース・ソフトウェアはNHocr、日語OCRシステムだ。Google Code上にホスティングされ、まだソースコードは一部しか開示されていないが、デモサービスは公開されている。 デモサービスでは、BMP/JPEG/PBM/PGM/PPMのファイル(さらに各ファイルをGZip圧縮していても可能)をアップロードすると、それを解析した結果を日語表示してくれる。日語OCRとあって、漢字/ひらがな/片仮名/英語などが判別可能になっている。 読み取らせた画像 手書き文字であっても認識率はそこそこ高い。正式リリースがまだという段階にあ

    MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介
  • 画像内の文字をコピー&ペーストする

    資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。 クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。 この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを

    画像内の文字をコピー&ペーストする
    niidome
    niidome 2007/10/30
  • スクリーンショット+OCRを実現する『Kleptomania』 - 100SHIKI ~ 世界のアイデアを日替わりで ~

    StructuRiseのKleptomaniaはちょっと便利そうだ。 このソフト、いわゆるスクリーンショットを撮ってくれるのだが、同時にOCR的な機能をもっているところがよい。 つまり、撮ったスクリーンショットに映っている文字を自動的に認識して、テキストに変換してくれるのだ。 そのままテキストをコピーできないような画面の説明をするときに重宝するだろう。 いまだにマニュアルでテキストを書き写しているような作業は他にないだろうか。ちょっと考えてみると新しいアイディアが浮かんでくるのかもしれませんね。

    スクリーンショット+OCRを実現する『Kleptomania』 - 100SHIKI ~ 世界のアイデアを日替わりで ~
  • 1