[B! OCR] okinakaのブックマーク

第770回　UbuntuとOCRmyPDFでスキャンした内容に対して自動的にOCRを実行する | gihyo.jp

今回はブラザーのスキャナーでスキャンした結果を自動的にOCRを実行します。SambaやOCRmyPDF、Tesseract OCRなど、オープンソースソフトウェアだけで構成します。紙の書類をなんとかしたいペーパーレスなんて言葉はもう聞き飽きてしまいましたが、実際にペーパーレスが達成されたかというとそういうわけでもないことはみなさんも日々感じていることでしょう。なにかのサービスに契約したらユーザー名とパスワードは郵送されてくるなんてことはむしろ最近増えています。本人確認のためには致し方ないところではありますが。昔のWi-Fi ルーターはメーカーによって初期ユーザー名とパスワードが決まっていましたが、セキュリティ的には問題しかありません。そのため最近はWi-Fi ルーターの箱にユーザー名とパスワードが書かれた紙（某社だとシール）が入っています。たしかにこれだと安心ですが、こんなの失くすに決

okinaka 2023/08/09

リンク

オープンソースのOCRエンジン　Tesseract-OCR - はだしの元さん

2013-10-14 オープンソースのOCRエンジン　Tesseract-OCR Tesseract-OCR(テッセラクトOCR)はGoogleが提供しているOCRエンジンです。このTesseract-OCRはオープンソースであることもさることながら、機械学習によりさまざまな言語に対応したり、精度を上げることができることも魅力の一つです。今回はそのTesseract-OCRをUbuntuにインストールするところから、実際に文字を読み取るまでを紹介したいと思います。また公式のドキュメントの他に以下のサイトを参考にさせていただきました。日々是酩酊 http://badly-drunk.blogspot.jp/2011/10/tesseractocr.html公式：tesseract-ocr https://code.google.com/p/tesseract-ocr/ インストー

okinaka 2014/08/21

ocr

リンク

Tesseract-OCRの学習 - はだしの元さん

2014-01-15 Tesseract-OCRの学習 Tesseract-OCRはHPが開発し現在はGoogleが公開しているオープンソースのOCRエンジンです。オープンソースのOCRエンジン Tesseract-OCRでTesseeract-OCRで日本語の読み込みまでは説明しました。今回はTesseract-OCRで機械学習を行い精度を向上させるための方法を説明します。僕は基本的に以下の公式のチュートリアルを読みながらやって行きました。Tesseract Training Wiki https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3大まかにやることは３つあります。 boxファイルの作成　 trファイルの作成トレーニングデータの作成 boxファイルの作成まず学習したい画像ファイルを用意します。今回

okinaka 2014/08/21

ocr

リンク

MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介

OCRという技術はアナログなデータをデジタル化する上で欠かすことができない。しかし様々な特許が絡み、オープンソースやフリーウェアとしては発展しづらい分野でもある。しかしそこに風穴を開けられるかも知れない技術が登場しそうだ。デモサービスで試せます今回紹介するオープンソース・ソフトウェアはNHocr、日本語OCRシステムだ。Google Code上にホスティングされ、まだソースコードは一部しか開示されていないが、デモサービスは公開されている。デモサービスでは、BMP/JPEG/PBM/PGM/PPMのファイル（さらに各ファイルをGZip圧縮していても可能）をアップロードすると、それを解析した結果を日本語表示してくれる。日本語OCRとあって、漢字/ひらがな/片仮名/英語などが判別可能になっている。読み取らせた画像手書き文字であっても認識率はそこそこ高い。正式リリースがまだという段階にあ

okinaka 2008/09/12

日本語OCR

ocr

リンク

Tesseract OCR

A commercial quality OCR engine originally developed at HP between 1985 and 1995. In 1995, this engine was among the top 3 evaluated by UNLV. It was open-sourced by HP and UNLV in 2005. (NOTE: We're migrating to code.google.com. Please see the forums.)

okinaka 2007/06/23

OCR

リンク

WeOCR Project Home

Since Feb. 2005 / Last update: Sep. 15, 2019 End of Services Thank you very much for using the WeOCR services for more than twelve years. As we can see a lot of nice online OCR systems today, I have decided to close our services. The servers will be shutdown gradually, although some will rem ain working only for demonstration purposes. When I started developing "Online OCR service" in 2004, there w

okinaka 2007/05/15

OCR

リンク

はてなブックマーク

タグ

関連タグで絞り込む (3)

OCRに関するokinakaのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス