[B! OCR] enemyoffreedomのブックマーク

GitHub - ocrmypdf/OCRmyPDF-EasyOCR: OCRmyPDF EasyOCR plugin

enemyoffreedom 2025/03/07

OCRmyPDFでEasyOCRを利用するためのプラグイン。Google Cloud Vision向けのプラグインはないか

OCR

リンク

Tesseract OCR VS EasyOCR｜猩々博士

はじめにAITuberとノベルゲームを共に楽しむために、ゲーム内のテキストを読み取り、AITuberが読み上げるシステムの構築を目指しています。この記事では、Pythonで利用可能な複数のOCR（光学文字認識）ライブラリを試し、それぞれの認識精度と性能を比較してみました。 OCRライブラリの選定今回検証したライブラリは以下の通りです： Tesseract OCR: オープンソースで広く使われているOCRエンジン。 EasyOCR: ディープラーニングに基づく別の人気OCRツール。認識テストに用いた画像テスト画像1: ゲームスクリーンショットをトリミングのみ実施ドキドキ文芸部よりテスト画像2:画像1を画像処理したデータ白ピクセル以外を塗りつぶし実装とテストPython環境でこれらのライブラリを実装し、同じノベルゲームのスクリーンショットを使ってテストを行いました。主な焦点は、認識精度

enemyoffreedom 2025/03/07

OCR

リンク

GitHub - ocrmypdf/OCRmyPDF: OCRmyPDF adds an OCR text layer to scanned PDF files, allowing them to be searched

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

enemyoffreedom 2025/03/07

PDFを後からOCRしてテキストレイヤーを追加するツール。エンジンにTesseract OCR、あとEasyOCRも使える？

OCR

リンク

ScanSnapで一万冊の本をスキャンして管理して読むおはなし - Qiita

という感じで、「人間の頭を頂点とした階層型ストレージを組み、そこに書籍をいれる」というお話がこの記事のキモになります。 Evernote社自体がDropboxやGoogle Driveを下層ストレージとして扱う機能を提供していればいいのですが、現状ではEvernote社とDropbox社はライバルみたいなものですから（実際は使い方が全く異なるにも関わらず)、このようなことは自分でやるしかありませんね。また、必要に応じてこれらの階層を外から補助するソフトを使います。前提 linux, docker, kvm, ghostscript, imagemagickなどの知識があること ISBNのない本も多いので、あればラッキーとすること windowsの正規余剰ライセンスがあること Adobe Acrobat (NOT Reader) windows版の正規余剰ライセンスがあること Evern

enemyoffreedom 2025/01/23

最終更新2023年05月の記事

自炊
OCR

リンク

第770回　UbuntuとOCRmyPDFでスキャンした内容に対して自動的にOCRを実行する | gihyo.jp

今回はブラザーのスキャナーでスキャンした結果を自動的にOCRを実行します。SambaやOCRmyPDF、Tesseract OCRなど、オープンソースソフトウェアだけで構成します。紙の書類をなんとかしたいペーパーレスなんて言葉はもう聞き飽きてしまいましたが、実際にペーパーレスが達成されたかというとそういうわけでもないことはみなさんも日々感じていることでしょう。なにかのサービスに契約したらユーザー名とパスワードは郵送されてくるなんてことはむしろ最近増えています。本人確認のためには致し方ないところではありますが。昔のWi-Fi ルーターはメーカーによって初期ユーザー名とパスワードが決まっていましたが、セキュリティ的には問題しかありません。そのため最近はWi-Fi ルーターの箱にユーザー名とパスワードが書かれた紙（某社だとシール）が入っています。たしかにこれだと安心ですが、こんなの失くすに決

enemyoffreedom 2023/08/02

OCR

リンク

Google DocsのOCR変換機能が日本語に対応

PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日本語に対応した。米Googleは2月28日（現地時間）、昨年6月にGoogle Docsに追加したOCR（光学式文字認識）機能を、新たに日本語を含む29カ国語に対応させたと発表した。日本語のPDFやスキャナやデジカメで取り込んだ文字を含む画像をGoogle Docsにアップロードすると、ファイルがテキストデータに変換される。使い方は、Google Docsの「アップロード」の画面で変換オプションを以下のように設定し、「アップロードを開始」をクリックする。変換が可能なファイル容量の上限は2Mバイトだ。実際にやってみたところ、PDFではほぼ問題なくテキストに変換されたが、デジカメで撮影した画像からの変換の精度はまだ高いとはいえないようだ

enemyoffreedom 2011/03/03

リンク

はてなブックマーク

タグ

関連タグで絞り込む (4)

OCRに関するenemyoffreedomのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2025年8月第2週）

今週のはてなブックマーク数ランキング（2025年8月第1週）

月間はてなブックマーク数ランキング（2025年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス