エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Tesseract を使ってスクリーンショットからテキストを抜き出す - au Kabucom Engineer Blog
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Tesseract を使ってスクリーンショットからテキストを抜き出す - au Kabucom Engineer Blog
システム技術部の木田です。小ネタです。 古いドキュメントを整理していたら、コマンド実行例などがスク... システム技術部の木田です。小ネタです。 古いドキュメントを整理していたら、コマンド実行例などがスクリーンショットで保存されていました。 「少量なら仕方ない」と、画像を見ながら手打ちでテキストを起こしていましたが、どうにも量が多いようなのでOCRで処理することにします。 Tesseract の Windwosバイナリ をインストールします。 "c:\Program Files\Tesseract-OCR\tesseract.exe" image.png - -l eng で標準出力にOCRでスキャンした結果を表示してくれます。 おわり。 Tesseract はとても扱いやすい OCR エンジンなので、インストールしてコマンドを叩くだけで簡単にテキスト起こしをしてくれます。 しかし、これを実際にやってみると「画像に文字以外の物が含まれるので結果にゴミが混ざる」「画像がSVG形式なのでPNGに変