0. はじめに 書けるネタを探しながらの投稿ですが、今回はOCRをやってみたので共有します。 なおせっかくなので連載ネタとして考えており、最終的にはGUIアプリをexe化して配布するところまで解説します 【第1回】Pythonで日本語OCR ←今回の記事 【第2回】PythonでオリジナルGUIアプリを作成 【第3回】Pythonで作成したアプリをexe化して配布する 動作環境 OS : Windows10 pro Python : 3.8.3 Tesseract : 5.0.0 pyocr : 0.8 jupyter notebook 1. Tesseractの導入 導入記事は無数にあり、今更ここに書いても冗長になってしまう為、わかりやすく書かれていた以下参考サイト(ひつじ工房様)の「tessreractインストール」の部分で入れていただければOKです。 ・選択肢に紛らわしい「javan
Pythonでコマンドライン引数を扱うには、sysモジュールのargvかargparseモジュールを使う。sysもargparseも標準ライブラリに含まれているので追加のインストールは不要。 sys.argv --- システムパラメータと関数 — Python 3.11.4 ドキュメント argparse --- コマンドラインオプション、引数、サブコマンドのパーサー — Python 3.11.4 ドキュメント sys.argvは非常にシンプルで簡単に使えるが、引数の個数に応じた処理や型変換を自分で行う必要がある。argparseは設定のためのコードが必要だが、オプションを使ったり任意の個数の引数を扱ったりできる。 決まった個数の引数に対して処理を行うのであればsys.argvで十分だが、コマンドラインツールとして使うような場合はargparseを使ったほうが柔軟に引数を処理できて便利。
概要 matplotlibの日本語フォントをインストールしたい時に、以下のような手作業の方法がググったときに結構出てきたが、環境によってフォルダ構成が異なったりするので、それっぽくやってみても上手くいかなかった。 こういうファイルを手作業で移動したり消したりをなしに日本語のフォントをインストールできる方法を調べて実行したところ上手くいったのでまとめていく。 matplotlibの文字化け問題でハマった時のメモ 【Python 3.6】matplotlibを日本語化する ちなみに、上記の記事でも同様の環境であればできますし、上記のように解決方法を公開していただけることに関しては非常にありがたいと考えていますので、これらの記事への批判がしたい訳ではないのであしからず…。 方法1: ターミナルからIPAフォントをインストールして、(おすすめ) ターミナルで以下のコマンドでIPAフォントをインスト
0.準備 1.ソースのダウンロード 2.ダウンロードしたソースの展開 3.コンパイル&インストール 4.バージョン確認 #準備 sudo apt-get update sudo apt-get upgrade -y #ソースのダウンロード wget https://www.python.org/ftp/python/3.9.4/Python-3.9.4.tgz #ダウンロードしたソースの展開 tar zxvf Python-3.9.4.tgz #コンパイル&インストール cd Python-3.9.4 ./configure make sudo make install #バージョン確認 python3.9 -v
概要 WSL2 + Ubuntu20.04 + pyenvという環境で、Python 3.11.1を導入しようとしたところ下記のように lzma についてWARNINGが発生しました。 試そうとしているモジュールがlzmaを使うようなので対処メモを記録します。 インストールした際の状態 メッセージ内容はこんな感じでしょうか lzmaライブラリがシステム上にないのでlzmaエクステンションはコンパイルされませんでした。 (それでも) Python3.11.1はインストールしました。 $ pyenv install 3.11.1 Downloading Python-3.11.1.tar.xz... -> https://www.python.org/ftp/python/3.11.1/Python-3.11.1.tar.xz Installing Python-3.11.1... Trace
株式会社神戸デジタル・ラボ DataIntelligenceチームの原口です。 今回は、GitHubで公開されているAIモデル「EasyOCR」を用いて文字認識に取り組みます! 本稿は、以下の条件に当てはまる方を想定して発信します。 Pythonが利用できる方 新しい技術に興味がある方 文字認識に興味がある方 OCRとは? 利点1:認識した文字をデータとして利用することができる 利点2:他言語へ簡単に翻訳できる EasyOCRとは? 準備 実際に検出してみた まとめ OCRとは? OCRの流れ OCR(Optical Character Recognition または Reader)とは、紙面上に存在する文字をカメラで撮影し、その画像をプログラムやAIで解析することで、紙面上の文字をデジタルデータに変換する技術のことを指します。 紙面上に存在する文字をデジタルデータに変換すると、どのような
Pythonの画像処理ライブラリPillow(PIL)のImageDrawモジュールに、円や四角、直線などの図形を描画するメソッドが多数用意されている。 ImageDraw Module — Pillow (PIL Fork) 4.4.0.dev0 documentation ここでは以下の内容について説明する。 Pillow(PIL)のImageDrawで図形を描画する流れ Drawオブジェクト生成 図形描画メソッドで図形を描画 図形描画メソッドの共通の引数 座標: xy 塗りつぶし色: fill 枠線の色: outline 図形描画メソッドの例 楕円、四角 直線、多角形、点 円弧、弦、パイ 読み込んだ画像の上に描画 Pillow(PIL)の基本的な使い方および文字の描画については以下の記事参照。 関連記事: Pythonの画像処理ライブラリPillow(PIL)の使い方 関連記事: P
pip install 時のエラー(pip is configured with locations that require TLS/SSL, however the ssl module in Python is not available.)Pythonerrorpip Retrying (Retry(total=0, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError("Can't connect to HTTPS URL because the SSL module is not available.",)': /simple/pip/ Could not fetch URL https://pypi.org/simple/pip/: There wa
import easyocr image_path = 'texts.jpg' reader = easyocr.Reader(['en']) # this needs to run only once to load the model into memory results = reader.readtext(image_path) これだけ。 結果は [xyxy座標, テキスト, 信頼度] [([[1242, 3507], [2285, 3507], [2285, 4207], [1242, 4207]], '10', 0.9998860368237108), ([[1201, 4275], [2261, 4275], [2261, 4738], [1201, 4738]], 'kmlh', 0.9946403503417969)] 使用可能な言語は以下で、二つ以上の言語を同時検出で
HTTP RequestをデバッグしたいのでpythonでHTTP Serverを起動してPOSTのBodyとGETのHeaderを確認してみる。 環境CentOS7でデフォルトで入っているPythonを使う。 $ cat /etc/centos-release CentOS Linux release 7.2.1511 (Core) $ python -V Python 2.7.5 確認はしていないが、CentOS6のPython2.6.6でも動作すると思う。Python2系では動作するがPython3系ではモジュールの名前がhttp.serverに変わっているっぽいので動かない。 HTTP Server起動Pythonでは次のコマンドで簡単にHTTP Serverが起動できる。
UA偽装できました! 金曜日に上の人と話し、「自動化するとしたらUA偽装できないと実用価値ないね」という事になり、pythonで偽装できる方法を探したところ、案外あっさり出来ました。 import os from selenium import webdriver options = webdriver.ChromeOptions() #ここにUAを書きます。今回はiPhoneでsafari options.add_argument('--user-agent=Mozilla/5.0 (iPhone; CPU iPhone OS 10_2 like Mac OS X) AppleWebKit/602.3.12 (KHTML, like Gecko) Version/10.0 Mobile/14C92 Safari/602.1') # いつもどおりchromedriverの場所を指定します
Pythonのビジュアライゼーションライブラリseabornを使うと、二次元データを可視化するヒートマップが簡単に作成できる。 seaborn.heatmap()関数を使う。 seaborn.heatmap — seaborn 0.8.1 documentation pandasは必須ではないが、二次元データとしてpandas.DataFrameを用いると行名・列名がそのままx軸・y軸のラベルとして表示されて便利。 ここでは、以下の内容について説明する。 seaborn.heatmap()関数の基本的な使い方 オブジェクトとして操作 seaborn.heatmap()関数の主な引数 数値を表示: 引数annot カラーバー表示・非表示: 引数cbar 正方形で表示: 引数square 最大値、最小値、中央値を指定: 引数vmax, vmin, center 色(カラーマップ)を指定: 引数
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く