[B! Python][OCR] masayoshinymのブックマーク

masayoshinym id:masayoshinym

PythonとOCRに関するmasayoshinymのブックマーク (4)

Pythonで始めるドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python
ビジネス文書をデータ化し構造や内容を理解するアプリケーションはドキュメント・インテリジェンスと呼ばれ、画像処理や自然言語処理といった複数の要素技術を組み合わせて開発する必要があります。何が必要でどう実現すれば良いのかといった第一歩を、Pythonでの具体的な構築事例とともに紹介します。 https…
masayoshinym 2021/10/20
Python

OCR

開発の現場

プログラミング系読物
リンク
Python&Plotlyを使って、OCR結果を画像上でインタラクティブに可視化する
概要 OCRを使った文字読み取りの開発をしていると、読み取られたテキストと画像と見比べて結果の確認をすることがよくあります。読み取られたこの文字は画像のどこから出てきたのかとか、単語の区切りが不自然なときになぜそうなったのかとかといった確認の際には、テキストとその座標から画像中の該当箇所を見つける必要があり、人間が目視で行うにはなかなか大変な作業です。物体認識などのタスクでは、画像上に四角形のバウンディングボックスを物体名のラベルとともに描写して可視化していますが、OCRの読み取りの場合は文字が画像上で密に配置されていたりと、画像上に直接描写するには情報量が過多になってしまいます。なるべくインタラクティブに操作出来る形で情報を表示し、必要な部分だけを確認できるようにしたい場合が多いです。この記事では、OCR読み取りの結果を画像上に描写して、インタラクティブに結果を確認する方法を紹介します
masayoshinym 2021/02/22
OCR

Python

実装テク

いつか試す
リンク
Azure Computer Vision APIでテキスト抽出（Read API）やーる（Python3.6） - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
masayoshinym 2020/11/02
Python

OCR

実装テク
リンク
Python3系でtesseractを使ってOCRをやってみる - しゃちの備忘録
前回の続きです．今回はPythonでtesseractを使い，OCRをしてみるところまで挑みたいと思います． OCR(工学文字認識)そのものについては前回書いたので省略します． teru0rc4.hatena blog.com tesseract tesseractのインストール tesseractとはGoogleで開発されているOCRエンジンです． homebrewを使いインストールします(homebrewについては過去に記事書いているのでご参照下さい) $ brew install tesseract みょろみょろログが出て，インストール完了です．実は最初の状態だと英数字にしか対応していません. ので，次節にて日本語対応させたいと思います．その前に，現在のtesseractのバージョンと，対応言語の確認をして起きたいと思います．バージョンの確認は $ tesseract -v か
masayoshinym 2019/04/10
Python

OCR

temp
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx