エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
字幕から文字抽出してみた(OpenCV:tesseract-ocr編) - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
字幕から文字抽出してみた(OpenCV:tesseract-ocr編) - Qiita
はじめに ここでは政見放送の下に表示される字幕から文字を抽出してみようと思います。 背景が何もない... はじめに ここでは政見放送の下に表示される字幕から文字を抽出してみようと思います。 背景が何もないので二値化でなんとかなりそうです。 google cloud vision API で 文字抽出するとかなりの精度で文字と配置(position)を取得することはできるのですが、ここでは他の方法で文字を取得しようと思います。 tesseract-ocr / pyocr 最初に tesseract と pyocr を使って文字認識させてみます。 ソースの画像です。 下記のスクリプトで文字と位置を抽出します。 import sys import pyocr import pyocr.builders import cv2 from PIL import Image def imageToText(src): tools = pyocr.get_available_tools() if len(to