KDDIは10月1日、米scanRが提供する、携帯電話で撮影した写真をPDFやアドレス帳データなどとして利用可能なサービス「スキャンR」を、EZwebとBusiness EZの公式コンテンツとして提供すると発表した。月額利用料は315円で、サービス開始は10月4日から。 スキャンRは、ホワイトボードや文書をカメラで撮影し、メールに添付してサーバに送信することで、データのPDF化が行えるサービス。PDFファイルに変換されたデータは、サーバからメールやFAXで送信することもできる。また名刺を撮影してサーバに送ると、携帯電話のアドレス帳形式(vCard形式)にも変換してくれるため、そのままアドレス帳に登録することも可能だ。サーバに送信したデータは、PCや携帯電話からアクセスでき、簡単にデータの閲覧・管理が行える。 スキャンRの利用イメージ。写真をメールに添付してサーバに送るとPDFやvCardに
「カラーOCRライブラリー」は、ソフトウェア開発者向けにOCRソフト用の開発キット(SDK)として、活字認識、帳票認識、名刺認識、QRコード認識のOCRライブラリー製品をご提供しています。各ライブラリーをお客様の既存ソフトウェアやシステムに組み込むことで、多彩なOCR機能を付加することができます。 また、当社では各ライブラリーを利用して、日本語・英語活字カラーOCRソフト「読取革命」や帳票OCRソフト「帳票OCR」、名刺管理ソフト「名刺読取革命」などを製品化しており、現在では高い認識精度と優れた操作性が評価され、さまざまな業種・部門で当社のOCR技術が活用されています。今回、さらに多くのソフトウェア開発者の方々に日本語活字OCR技術を手軽にご利用いただけるように、「活字認識ライブラリー」の機能拡張と性能向上を図りました!( 最新情報へ進む)
資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。 クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。 この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを
OCRopus is a collection of document analysis programs, not a turn-key OCR system. In order to apply it to your documents, you may need to do some image preprocessing, and possibly also train new models. In addition to the recognition scripts themselves, there are a number of scripts for ground truth editing and correction, measuring error rates, determining confusion matrices, etc. OCRopus command
昨日に引き続きOCRソフトウェアのご紹介。このOCRと言う分野は今後のデジタル化推進の上で重要な技術になり得るのだが、どうもオープンソースではあまり流行っていない。 そんな中、数少なくも存在するOCRエンジンがこれだ。 今回紹介するオープンソース・ソフトウェアはGNU Ocrad、CUIベースのOCRエンジンだ。 GNU Ocradは画像を使って文字抽出が可能だが、その形式はPBM、PGM、PPM、PNMに限定される。通常の画像(PNGなど)であれば、ImageMagick等を使って変換する必要がある。 実際に認識させてみた限りでは結果は良好だ。手書き等ではあまり良くないだろうが、コンピュータ出力の文字列を認識させたり、新聞や雑誌などの文字であればまずまずなのではないかと思う。 もちろん、日本語の解析はできないので、運用される場面は限られてしまうだろう。だが、英文の文書や写真などの解析では
米Googleは,オープンソース・コミュニティSourceForge.netで文字認識(OCR)エンジン「Tesseract」を公開した。Google最上級技術リード(Uber Tech Lead)のLuc Vincent氏が米国時間8月,公式ブログGoogle Code Blogへの投稿で明らかにしたもの。SourceForge.netのWebサイトから無償でダウンロードできる。 Tesseractは,米Hewlett-Packard(HP)が1985~1995年にかけて開発していたOCRエンジン。ネバダ州立大学ラスベガス校(UNLV)が1995年に開催したOCRソフトウエアの精度を評価するコンテストで,トップ3の成績を記録したという。しかしHPがOCR事業からの撤退を決めたことから,「Tesseractはほこりをかぶっていた」(Google)。 その後「HPの関係者がTesseract
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く