字幕から文字抽出してみた(OpenCV:tesseract-ocr編) - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/satsukiya

3 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

字幕から文字抽出してみた(OpenCV:tesseract-ocr編) - Qiita

はじめにここでは政見放送の下に表示される字幕から文字を抽出してみようと思います。背景が何もない... はじめにここでは政見放送の下に表示される字幕から文字を抽出してみようと思います。背景が何もないので二値化でなんとかなりそうです。 google cloud vision API で文字抽出するとかなりの精度で文字と配置(position)を取得することはできるのですが、ここでは他の方法で文字を取得しようと思います。 tesseract-ocr / pyocr 最初に tesseract と pyocr を使って文字認識させてみます。ソースの画像です。下記のスクリプトで文字と位置を抽出します。 import sys import pyocr import pyocr.builders import cv2 from PIL import Image def imageToText(src): tools = pyocr.get_available_tools() if len(to

ブックマークしたユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx