[B! OCR] meerkatのブックマーク

meerkat id:meerkat

OCRに関するmeerkatのブックマーク (32)

スキャンしたpdfファイルにOCR処理を行い,テキスト埋め込みpdfを作成する - Qiita
はじめにスキャナーで取り込んだ書籍や,ダウンロードしてきた論文pdf等は,内部にテキストデータが保持されていません。よって,検索などの機能を使うことができず,不便な思いをすることがありました。そこで,OCR(光学文字認識)エンジンであるTesseractを用いて,画像から文字の抽出を行い,それらの文字データをpdfに埋め込んだ形でpdfファイルに保存する方法を調べてみました。大まかな手順は pdf から画像形式(png or ppm)へ変換画像ファイルに対し,tesseractを用いて文字認識,抽出,文字データの埋め込まれたpdfの作成作成されたpdfファイル群を一つのpdfファイルにまとめるです。以下では,順に説明していきます。 0. tesseractのインストールと,その前に,tesseractのインストールを行います。Wikiにも書いてあることをそのまま書きます。詳
meerkat 2020/01/05
OCR

PDF
リンク
PDFやJPEGなど画像データの文字を文字認識（OCR）させる無料の方法。 | PC＆IT ～i-TSUNAGU～　
「PDFやJPEGなど画像ファイル内の文字を文字情報として認識させ、活用したい」「ある程度精度の高いOCRをコストをかけずに（できれば無料で）利用したい」といった声をよく耳にします。文字情報が含まれていない画像ファイル※内の文字は、画像情報になりますので、そのままでは文字（テキスト）情報として抽出、コピーをしたり、検索をかけるなど再利用・活用することは出来ません。 ※画像ファイルでも文字情報が含まれているものもございます。画像ファイル内の文字文字情報を含んでいる場合には下のように文字列を選択することができる状態になっています。文字として認識していますので文字列で検索をかけることも可能です。これに対して、文字情報が含まれていない場合は、文字列の選択や検索を行うことが出来ません。 OCRについて画像情報としての文字を文字情報として扱えるようにするには、OCR（光学文字認識）という技
meerkat 2020/01/05
OCR

PDF

google
リンク
PDFから簡単変換！プロ：PDFをWord/Excel/PPT等に1クリックで変換
meerkat 2016/10/28
OCR

PDF
リンク
認識率98.66％？！たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた | Ledge.ai
記事ネタを集めていたところ、代官山で日本語の手書き認識ソフトウェアの開発に成功した外国人グループがいる。それもたった２か月で。という記事にあたりました。日本語の手書き文字のOCRを外国人が開発しているという驚き。気になりすぎたので、早速取材にいってみたところ、Reactive Inc.のデータサイエンティストのDavid MalkinさんとコアエンジニアのPhilip Irriさんにお話しを聞くことができたので、まとめてみました！非エンジニアにもわかるようにと噛み砕いて、システムの内容や今後の拡張計画ディープラーニングの可能性についてまでいろいろ話してくださいました。
meerkat 2016/06/16
OCR

deeplearning

ai

日本語
リンク
しおり（目次）のないPDFなんて読めるかっ！（後編）
目次のページだけをやや高画質でスキャンしてOCRソフトにかける。レポート等で文字情報が含まれているPDFならコピペでもOK。 OCRをかける時は目次内容とページ数は別セルとなるように表形式で。列ごとの文字種別は特に指定しなくても割と正確に認識するが、テンプレで指定できればした方が良いかも。多少の誤認識は無視する。（あとでExcel上で修正したり、PDFを閲覧中に気付いたら直す程度で良いかと）ちなみに、このような目次ページならラクなんだけど、
meerkat 2015/06/01
PDF

しおり

excel

OCR
リンク
「Renee PDF Aide」 - OCR機能を搭載し、画像内の文字列をテキスト化することも可能なPDF変換ソフト
Renee PDF Aide OCR機能を搭載し、画像内の文字列をテキスト化することも可能なPDF変換ソフト多言語対応のOCR（光学式文字認識）機能を搭載した、簡単操作のPDF変換ソフト。複数ファイルを一括変換することも可能。「Renee PDF Aide」は、PDF形式の電子文書ファイルをMicrosoft Office文書などに変換できるドキュメントコンバータ。変換元のPDFファイルをリストに登録し、出力したい文書の形式を選択・実行するだけで変換することが可能。変換できるのはMicrosoft Word、Excel、PowerPointのほか、EPUB、テキスト、HTML、画像の各形式。OCR機能により、画像ファイル内の文字を認識してテキストファイルに出力したり、画像から作成されたPDFをほかの形式に変換したりすることもできる。出力形式の選択は、メイン画面上部に並んだ大きなボタンで
meerkat 2015/05/29
PDF

OCR

変換

テキスト
リンク
比較2016' 現行の日本語OCRソフト3機種の性能とおすすめ：縦書き文章の論文、英語日本語混在論文における性能や価格：Panasonic：読取革命 ver.15、エプソン・メディアドライブ：e.Typist v.15.0 Ado
Top ＞研究道具（ソフトウェア）＞比較2024'【20年使用】OCRソフト29点の性能とおすすめ【日本語・外国語OCR】：資料・名刺・縦書き文書認識、英語日本語混在文書の精度【今回レビューする製品】2024年おすすめ日本語対応OCRソフトの認識精度と選び方：製品版・無料版・バンドル版対応：変換精度の違いやおすすめランキングやOCRフリーソフトとの違いについて【紹介するソフト一覧】ソースネクスト読取革命 ver.16 Panasonic 読取革命 ver.15 メディアドライブe.Typist v.15.0 Adobe Acrobat Standard Pro 透明PDF ソースネクスト本格読取 5 ABBYY FineReader for ScanSnap ファイル管理革命Lite 読んde!!ココパーソナルVer.4 読取革命Lite やさしく名刺ファイリング PRO
meerkat 2015/05/27
OCR

PDF

透明テキスト

検索
リンク
『【C：編集編】１、OCRソフト Panasonic 読取革命 ver.15 購入レビュー』
南国人にゃんちゅう☆の秘密の日常南国九州男児の情報工学系の技術者/研究者のひよっこが書くブログ♪ ゲーム情報の他、こんな記事有ったらいいな～無くて困った！という物を中心に色々書いていきます。まだまだ青臭さ溢れる未熟者ですが、頑張りますので宜しくお願い致します。こんにちは。にゃんちゅう☆です。今回はPanasonic 読取革命 ver.15 (2012年9月21日発売) というOCRソフトの購入レビューをします。 OCRソフトはPDFデータの文字を読取り、検索、文章コピペ可能な物に作り替えられる魔法の道具です。だって、これがある事で膨大な自炊データを検索可能なデータベースに変えられるのですから。 ◆OCRソフトを購入した理由 OCR作業は自炊代行業者に頼まず、自前でした方が便利なことが多いからです。例えば、OCR作業も業者さんに頼んだとします。閲覧端末が1種類しかないといいので
meerkat 2015/05/27
OCR

PDF

透明テキスト

検索
リンク
OCRにより透明テキストつきPDFを作成可能になった「かんたん PDF ダイエット」
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
software/PDFDietEasy/PDF2ClearText - Windows Phone, Windows 8 Store アプリ by Smart-PDA.net
透明テキスト PDF の作成(OCR) 「かんたん PDF ダイエット」なら、透明テキストPDF の作成が出来ます。スキャンした PDF を透明テキストPDF にしておくと、文字列検索が出来るので便利です。 ScanSnap などのスキャナ付属のソフトを使うと簡単に透明テキストPDF作成が出来ますが、「かんたん PDF ダイエット」でもマイクロソフト製 OCR エンジン(無償)をインストールすることで「透明テキストPDF をショートカットにドラッグ＆ドロップするだけ」で作成することが出来ます。透明テキストPDFとは？ ↑ OCR エンジンのインストール透明テキストPDF の作成には、マイクロソフト製 OCR エンジンを使用しますのでインストールします。 ※Office 2007 をインストールされている方は既に OCR エンジンがインストールされている場合があります。スタートメニュー
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
窓の杜
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
いきなりPDF from スキャナ 3
本製品は、紙原稿をスキャナで読み込んで、OCR技術により透明テキスト付きPDFを作成するソフトです。紙のままではできない検索ができます。
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
PDFデータ変換・抽出・OCRソフト | 市販PDFソフトの紹介
市販されているPDF関連ソフトの中から、PDFファイルからデータを取り出す機能を持ったものを集めました。セキュリティがかかっていなければ、ファイル内のデータをカット＆ペーストで他のアプリケーションにコピーすることは可能ですが、手間がかかります。或いは、文章や数字が画像の形で変換されたものであれば、文字情報のカット＆ペーストはできません。これらのソフトを使うことで、簡単な操作でデータを抽出したり、文字認識機能により画像から文字情報を取り出す事ができます。いきなりPDF to Data Ver.5 瞬簡PDF 変換 2024 いきなりPDF from スキャナ 3 読取革命Ver.16 e.Typist v.15.0 いきなりPDF for 自炊 ABBYY FineReader 16 LightPDF ※PDFからDXFへの逆変換ソフトは、DXFファイル変換で紹介 ↑ トップペ
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
機能紹介：画像ファイルへ変換 - 瞬簡PDF 変換 2024
瞬簡PDF 変換 2024画像ファイルへ変換画像（BMP/JPEG/JPEG2000/PNG/TIFF/GIF）への変換『瞬簡PDF 変換 2024』は、PDFを画像ファイルに変換できます。また、JPEGファイルからPNGファイルなど異なる画像ファイルに変換することも可能です。変換時には解像度（DPI値）や減色（モノクロ、256色...）の指定など、画像ファイルに合わせた変換条件を設定できます。マルチTIFFファイルへの変換例 PDFからTIFFファイルへの変換例読み込み可能なファイル以下のファイルを読み込みできます。 PDFファイル（.pdf） ※PDF1.3～PDF2.0仕様のPDF ※Acrobat 8以降で作成されるパッケージ形式（ポートフォリオ機能）は、表紙PDFのみ変換します。 BMPファイル（.bmp） JPEGファイル（.jpg/.jpeg） JPEG2000フ
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
変換！PDF7 Professional | 株式会社ジャングル
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
OCRでOfficeファイルに高精度変換!! 瞬簡PDF OCR
『瞬簡PDF OCR』販売終了のお知らせ誠に勝手ながら 2018年7月6日をもって本製品の販売を終了いたしました。また、販売終了に伴い、ユーザーサポートについても2019年7月5日をもって終了いたします。長らくの間ご愛顧賜り、誠にありがとうございました。本製品につきまして後継製品はございませんが、今後PDFからOffice形式への変換については『瞬簡PDF 変換 10』をご検討下さい。『瞬簡PDF OCR』と『瞬簡PDF 変換 10』の機能比較瞬簡PDF OCR瞬簡PDF 変換 10
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
ソースネクスト：ページが見つかりません
お探しのページが見つかりません 404 Not Found ページが存在しないか、URLが間違っている可能性があります。 5秒後に自動で　TOPページ　に移動します。
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
Excel でファイル名をダブルクリックしてファイルを開くと、"ファイルが見つかりません" というエラーメッセージが表示される
This browser is no longer supported. Upgrade to Microsoft Edge to take advantage of the latest features, security updates, and technical support.
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
PDFDiet - Windows Phone, Windows 8 Store アプリ by Smart-PDA.net
インストール方法「かんたん PDF ダイエット」のインストール方法は簡単です。右のリンクから Zip ファイルをダウンロードし、適当なフォルダに展開して下さい。アンインストールはフォルダを削除するだけです。レジストリは使用しません。また動作させるために追加のパッケージが必要になりますので、以下の「追加のパッケージ」を参照して下さい。フォルダの展開が完了したら、そのフォルダに入っている "PDFDietEasy.exe", "PDF2Image.exe" のショートカットをデスクトップ上に作成します。これで終了です。あとは作成したショートカットに PDF ファイルやフォルダをドラッグ＆ドロップするだけです。詳しくは、かんたん PDF ダイエットの使い方 PDF から画像を取り出す普通の PDF を画像に変換する透明テキスト PDF を作成するに使い方が書かれています
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
OCR処理による透明テキスト付きPDF - 紙媒体のデジタル化
図面や書類をスキャンしてPDF形式で電子化した際、問題になってくるのは検索の問題です。ファイル名を工夫することで、ある程度は把握できるとしても、書類の内容はファイルを開いて見なければわかりません。数十ページに及ぶPDF書類であれば全てを確認するのは困難になりますし、データベースを利用してもスキャンしたデータの内容までは検索できません。この問題を解決するために、OCRで処理されたテキストデータをPDFに透明なタッチアップテキストとして貼り付ける「透明テキスト付きPDF」という手法があります。書類をスキャンした後にOCR処理し、透明なテキストをスキャンした画像に埋め込んだPDFファイルを作成します。単純にスキャンしたPDFと違い、OCR処理をする事で、アクロバットリーダーの基本的な機能を使い中身を検索することができるようになります。それまでの紙媒体の電子化では実現できなかった検索の
meerkat 2015/05/27
PDF

OCR

透明テキスト

変換
リンク
1 2 次のページ