[B! tech ocr] bleu-bleutのブックマーク

bleu-bleut id:bleu-bleut

tech ocrに関するbleu-bleutのブックマーク (17)

Tesseract 4.0で日本語の認識をチューニングしよう - Qiita
はじめにオープンソースのOCRとして手軽に試せるTesseractは、4.0になって認識制度が大幅に向上しているといいます。しかし、どうしても認識してくれない文字があります。一番困ったのが、会計の負数を意味する△マーク。AになったりΛになったり、とにかく△を知らない。そんなわけで、知らない文字を知っている状態にするには、独自の学習をさせてやることが必要です。 tesstrain.sh で Tesseract-OCR の言語データをカスタマイズするを参考にさせてもらいました。必要なファイルを取得まずはTesseract本体と、言語データのlangdataプロジェクトを取得。 $ git clone git://github.com/tesseract-ocr/tesseract.git $ git clone git://github.com/tesseract-ocr/langda
bleu-bleut 2020/11/14
Article

tech ocr
リンク
Cloud Vision APIをPHPから使ってみた。その① | TECH Projin
Cloud Vision API とは。早速試してみる。「Cloud Vision API」とは、Googleが提供しているクラウドサービスの一つです。 Googleのサイトでは以下の様に説明されています。 Google Cloud Vision API は、使いやすい REST API にパワフルな機械学習モデルが組み込まれており、画像の内容を認識するアプリケーションの開発を可能にします。画像の内容を読み取り、様々な情報を取得して戻してくれるということです。ネット上の多くの画像を解析してきたGoogleのなせる業ですね。いまいちピンとこない方は、以下のサイトで簡単に試すこともできます。 https://cloud.google.com/vision/?hl=ja こちらのgoogleのページにアクセスしてみると以下の様に「Try the API」とありますので、そこに何か画像をア
bleu-bleut 2020/11/14
Cloud Vision API

Article

tech ocr
リンク
Tesseractでサクッと日本語OCRを試してみる - もふもふ技術部
TesseractはPythonからオープンソースで使えるOCRエンジンで、テッセラクトと読むらしい。とりあえずインストールしたらサクッとOCRを試せるみたいなのでやってみる。こちらの記事を参考にした。 Tesseract+PyOCRで簡易OCRを試してみる - Qiita とりあえずOCRをしてみる日本語のOCR精度を上げるまとめとりあえずOCRをしてみるまずはインストールする。brewで一発。 $ brew install tesseract デフォルトでは日本語対応していないので、日本語の学習データを手動で入れる。データは三種類のリポジトリが用意されている。 tessdata_bestは最も精度が高いデータ tessdata_fastはたぶん最も速度が速いデータ tessdataは通常のデータ Data Files · tesseract-ocr/tesseract Wi
bleu-bleut 2020/11/14
Tesseract OCR 4

Article

tech ocr
リンク
CentOS7にTesseractをインストール【Tesseract5.0.0-alpha奮戦記】 - ホンモノのエンジニアになりたい
みなさん、こんにちわ。今日も元気にOCRしてますか？えっ？してない？働き方改革で生産性がホゲフガなこの時代に、してないですって？だってOCRソフトってお高いんでしょう？持ち合わせがございませんもの。ですって？ HAHAHA、なるほどなるほど、大丈夫！そう、Tesseractがあればね。 OCRなんてそんな古臭いプロダクトで遊んでる暇はない！ですって？ AIやRPAじゃないとカッコ付かないし、予算も下りないんだよ！ですって？ HAHAHA、なるほどなるほど、大丈夫。そう、Tesseractがあればね。 Tesseractは現在Googleが開発してるオープンソースのOCRエンジンです。タダで使えます。そのうえ最近のバージョンではいま流行りの機械学習の仕組みが入っています。更にこのソフトウェアの得意な作業はいわゆるRPAに通じるところがあります。偉い人は「当社もAIとRPAの導入に着
bleu-bleut 2020/11/12
Tesseract OCR 3/4/5

Article

tech ocr
リンク
フリーのOCRソフトTesseract 4 が簡単に使えるようになってました！ - digitalnagasakiのブログ
しばらく前から時々試してみていたTesseract ですが、気がついたらえらく使いやすい感じになっていたので、また試してみました。なんと、メジャーなLinuxディストリビューションごとにバイナリが用意されていたのです。こういうものは「Ubuntuだとこうやってインストールできます」という話が多くて、RHEL/CentOSユーザな私はコンパイル環境があわなくて泣きながら作業することが多かったのですが、今回はなんと、RHELにもCentOSにもバイナリが用意されています。さっそく、バイナリインストールです。 yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/ sudo rpm --import https://build.
bleu-bleut 2020/11/12
Tesseract OCR 4

Article

tech ocr
リンク
Google製OCRライブラリの「Tesseract」をEmscriptenでラップした「Tesseract.js」で日本語OCR試してみる｜ふじい
精度どんなもんやろか？　←　イマココタイトルの「Emscripten」はC/C++をJavaScriptに変換できるような奴（雑） EmscriptenEmscripten は LLVM のバイトコードの JavaScript へのコンパイラです。LLVM バイトコードは、developer.mozilla.org 環境構築（雑）適当にディレクトリ作ってコマンド叩く。 npm install tesseract.js適当にindex.jsとかファイル作ってExampleをコピペしてjpnに書き換える。日本語の文字列が書かれてるimage.pngを用意して、以下のコマンドを叩く。 node index.jsこれでコンソール上に画像の日本語が文字列として取得できるはず。試してみたimage.pngを差し替えてコマンドを叩く手作業を繰り返す。まず用意したのはこの画像。文字小さめ、そこそ
bleu-bleut 2020/10/29
Article

tech ocr
リンク
PHPでOCR（Google Cloud Vision APIを使って） - Qiita
画像から文字列を読み取る、OCRの処理をアプリに実装させたいというニーズは、よくあるでしょうが、割と手っ取り早いのはGoogleのCloud Vision APIを使うやり方かな、と思います。 PHPでの例を紹介します。 Cloud Vision APIとは？　使うには？　注意事項は？こちらに大変よくまとめてくださっているので、ご覧ください。 Cloud Vision APIをPHPから使ってみた。その① | TECH Projin https://tech.pjin.jp/blog/2017/07/31/cloud-vision-api-from-php-1/ PHPでcURLを使えるようにする環境によって様々のようなので、ここでは詳細は割愛。 Ubuntu 16.04の場合、 $ sudo apt-get update $ sudo apt-get install php-curl
bleu-bleut 2020/10/29
Cloud Vision APIにPHPからcurlでアクセス

Article

tech ocr
リンク
無料でできる！PHPで画像からテキストを読み取る方法
さてさて、このブログでは【Laravel + Google vision API】ウェブカメラで名刺を読みとって会員データ入力という記事を公開しています。これはGoogle Vision APIを使って画像から文字を取得するという内容なのですが、実はこのサービスは有料になっています。（ただし、実行回数が少なければ無料でいけますし、基本的に料金は安いです）正直なところ、精度を問われると間違いなくこういったクラウドのサービスを使うべきだと思いますが、もしかすると「精度は落ちてもいいので無料でやりたい」という需要があるのかなとも思いましたので、今回PHPを使って画像からテキストを読み取る（OCR）を無料でできる方法を紹介することにしました。というのも、これも以前公開したネットカフェ向けにコミックをどこまで読んだか記録するLINEボットをつくったという記事でつくったBotは、基本的にバーコー
bleu-bleut 2020/10/29
Tesseract OCRをUbuntuにインストール、PHPからexecコマンドで実行

Article

tech ocr
リンク
Release 0.2.0 · ku/screentextcapture
bleu-bleut 2020/10/29
type Github

tech ocr
リンク
Dropboxにユーザーのすべての画像とPDFを自動的にOCRする機能が登場 | TechCrunch Japan
The past year and a half have witnessed multiple startups facing valuation cuts as funding from VCs waned in an environment of rising interest rates. In this context, fintechs, especially buy now, pay Ahead of the AI Safety Summit starting tomorrow morning taking place outside of London in Bl etchley Park, today, the U.K. government has confirmed more details about who is actually going to be atten
bleu-bleut 2018/10/25
Article

webservice dropbox

tech ocr
リンク
Compressing and enhancing hand-written notes
Why do it by hand if you can code it in just quadruple the time? I wrote a program to clean up scans of handwritten notes while simultaneously reducing file size. Example input and output: Left: input scan @ 300 DPI, 7.2MB PNG / 790KB JPG. Right: output @ same resolution, 121KB PNG.1 Disclaimer: the process described here is more or less what the Office Lens app does already, and there’s probably
bleu-bleut 2016/12/21
Article

tech ocr
リンク
Tesseract.js | Pure Javascript OCR for 100 Languages!
Tesseract.js is a pure Javascript port of the popular Tesseract OCR engine. This library supports more than 100 languages, automatic text orientation and script detection, a simple interface for reading paragraph, word, and character bounding boxes. Tesseract.js can run either in a browser and on a server with NodeJS. Check out the Example code and API docs on GitHub.
bleu-bleut 2016/10/18
日本語もおけ。

Article

js lib

tech ocr
リンク
Gyazo Blog
Gyazo・Gyazo Teamsを日々ご愛用いただきありがとうございます。表題通りGyazo(Gyazo Teamsも含みます)の利用に際して、サポートブラウザの変更を行いましたので詳細についてお知らせします。また、このお知らせに関わる変更は既に実施済みです。主な変更点を以下に記します。各OSとブラウザの対応について明示するようにしました各OSについてバージョンは明記していません。各ブラウザの最新の安定版がご利用いただける環境でご利用ください Microsoft Edge(MS Edge)についてはChromium版のサポートとする旨明示しましたまた、これまでもGyazoではヘルプページなどでInternet Explorer 11(IE11)はサポートしていない旨をお知らせしていましたが、このお知らせ以降、IE11などで動作が保証されない変更を実施する予定ですので、改めてIE
bleu-bleut 2016/06/23
Article

webservice gyazo

tech ocr
リンク
TechCrunch | Startup and Technology News
Before Wazer came along, “water jet cutting” and “affordable” didn’t belong in the same sentence. That changed in 2016, when the company launched the world’s first desktop water jet cutter,…
bleu-bleut 2016/06/23
Article

webservice dropbox

tech ocr
リンク
TechCrunch | Startup and Technology News
Shopify has acquired Threads.com, the Seqiuoa-backed Slack alternative, Threads said on its website. The companies didn’t disclose the terms of the deal but said that the Threads.com team will join… Two senior police officials in Bangladesh are accused of collecting and selling citizens’ personal information to criminals on Telegram.
bleu-bleut 2016/02/20
Article

tech ocr
リンク
JSでCanvasに描いた文字等をOCRできる「Ocrad.js」:phpspot開発日誌
Ocrad.js - Optical Character Recognition in Javascript JSでCanvasに描いた文字等をOCRできる「Ocrad.js」。次のようにphpと文字を描いてみると認識される他、画像から文字を取得する事も可能。ブラウザ上でしかもプラグインなしでも実現できるのは凄いですね使い方も超簡単。関連エントリリンク先を先読みしてページの速度をあげるJSライブラリ「InstantClick」モダンなプログレスバーを表示できるJSライブラリ「nanobar.js」単体1KB以下で動作する遅延ローダーライブラリ「Echo.js」
bleu-bleut 2014/08/05
Article

js lib

canvas

tech ocr
リンク
PC
USBケーブルのワナ USBケーブル選びの落とし穴、慌てて選ぶと性能を発揮できないケースも 2024.07.26
bleu-bleut 2013/06/05
Article

js lib

tech ocr
リンク
1