並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 315 件 / 315件

新着順 人気順

ocrの検索結果281 - 315 件 / 315件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

  • Kindleの固定レイアウト書籍をPDF化してOCR処理 - マイ忘備録

    kindleの本で買った本で、固定レイアウトの本があるが、マジで使いにくい。小説ならまだしも、参考書で検索が使えないって、利用価値が半減 ※この商品は固定レイアウトで作成されており、タブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。 わざわざ電子書籍で出すのに、なんで出版社の方で検索できるフォーマットで出してくれないんだろう・・・不便すぎる。 ググってみると、"Kindleの本をPDFとしてエクスポートしてOCR処理を加える"やり方があったのでやってみた。環境はVirtualBox上のWindows10で試した。 Kindle本をPDF出力 このサイトを参考に キンドルでダウンロードした本をPDF化する | C#とMultiRowのプログラミング 以下のツールをダウンロード。CubePDFという

      Kindleの固定レイアウト書籍をPDF化してOCR処理 - マイ忘備録
    • OCRサービスで抽出したテキストデータをChatGPTに解析させる - Qiita

      はじめに 記事の対象者と目的 こんにちは!株式会社エンラプト開発チームです。本記事では、OCR(光学的文字認識)のサービスを活用したアプリケーション開発に関心がある皆さんに向けて、ChatGPTと組み合わせてOCRを利用する具体的な方法や特徴を解説します。 OCRサービスを利用すれば画像からテキストを抽出できますが、そのままのテキストではデータとして利用しづらい無秩序な形になってしまっています。 しかしながらChatGPTを利用することで、OCRから抽出したテキストを各項目へマッピングし、使用しやすいフォーマットに変更することが可能になります。 成果物 レシートの画像のURLを指定するとそのレシートの画像から日付、商品名、商品ごとの金額、合計金額をjson形式で出力してくれるアプリケーションを作成しました。 今回作成したアプリケーションのコードはgithubに公開しています。 OCRサービ

        OCRサービスで抽出したテキストデータをChatGPTに解析させる - Qiita
      • 凸版、明治~昭和初期の手書き文字を解読するAI-OCR。日本初

          凸版、明治~昭和初期の手書き文字を解読するAI-OCR。日本初
        • Google Colabを用いたNDL"古典籍"OCRアプリのチュートリアルを作成しました。

          概要 Google Colabを用いたNDL"古典籍"OCRアプリを作成しました。以下のURLからお試しいただけます。 NDL古典籍OCRの説明は以下です。 また、ノートブックの作成にあたっては、@blue0620さんのノートブックを参考にしています。ありがとうございます! 今回作成したノートブックでは、入力フォーマットの追加や、Googleドライブへの保存機能などを追加しています。 使い方 NDLOCRアプリの使い方とほぼ同様です。以下の動画を参考にしてください。 工夫 工夫した点として、認識結果をIIIFマニフェストの形に変換し、Miradorビューアで閲覧できるようにしました。具体的には、以下のような出力が得られます。 後者のリンクをクリックすることで、以下のようなMiradorビューアが表示され、認識結果を確認することができます。 このIIIFマニフェストファイルも、Googleド

            Google Colabを用いたNDL"古典籍"OCRアプリのチュートリアルを作成しました。
          • 請求書OCR自動化: Document AI + ChatGPT API で非構造化データを JSON で出力させる - GMOインターネットグループ グループ研究開発本部

            2023.10.05 請求書OCR自動化: Document AI + ChatGPT API で非構造化データを JSON で出力させる はじめに こんにちは。グループ研究開発本部 次世代システム研究室のT.D.Qです。 2023年10月よりインボイス制度が開始されます。この制度に対応するため、請求書のOCR自動化はますます重要となっています。今回は、ChatGPTとDocumentAIの力を結集し、インボイス制度への対応を加速する請求書OCR自動化の方法について探ってみたいと思います。 1.やりたいこと 目的: 非構造化データを OCR で取得して、指定の JSON 形式で出力させたい 使用する技術: OpenAIのChatGPT及びGoogleのDocumentAI 実現手段: DocumentAIで請求書(PDF形式)を読み取り ChatGPTでDocumentAIのレスポンスから

              請求書OCR自動化: Document AI + ChatGPT API で非構造化データを JSON で出力させる - GMOインターネットグループ グループ研究開発本部
            • シナモン、製造業界の書類に特化したAI-OCR「ぜんぶよむもん」を本格販売 | IoT NEWS

              株式会社シナモン(以下、シナモンAI)は、手書きと活字いずれの書類でも文字を自動認識し、テキスト抽出することができるAI-OCRモデル「Flax Scanner」において、製造業界の書類(紙文書)に特化したAI-OCR「ぜんぶよむもん」を、2023年2月3日より本格販売する。 「ぜんぶよむもん」は、製造業における紙文書の手書きと活字、いずれの文字においてもテキストデータ化する。これにより、文章の中身を含めた検索が可能となる。 また、製造業界で頻出する専門用語が記載された各種資料に対応しており、仕様書、報告書、点検記録、図面、実験・試験データ、取扱説明書、マニュアル、専門誌、調査資料、契約書といった書類に使用することが可能だ。 そのほか、「ぜんぶよむもん」には、シナモンAIが独自開発した、座標定義など、導入時の事前設定が不要となる「全文AI-OCR」を搭載している。そのため、試験導入から本格

                シナモン、製造業界の書類に特化したAI-OCR「ぜんぶよむもん」を本格販売 | IoT NEWS
              • 国内OCR市場は2023年まで年平均25.5%で成長、2023年度に160億円規模に─ITR | IT Leaders

                IT Leaders トップ > テクノロジー一覧 > ミドルウェア > 調査・レポート > 国内OCR市場は2023年まで年平均25.5%で成長、2023年度に160億円規模に─ITR ミドルウェア ミドルウェア記事一覧へ [調査・レポート] 国内OCR市場は2023年まで年平均25.5%で成長、2023年度に160億円規模に─ITR 2019年11月19日(火)日川 佳三(IT Leaders編集部) リスト アイ・ティ・アール(ITR)は2019年11月19日、国内のOCR(光学文字認識)市場規模の推移と予測を発表した。2018年度のOCR市場の売上金額は52億円、前年度比45.3%増の伸びを示した。2019年度も同53.8%増の伸びを予測している。2023年度には160億円、2018~2023年のCAGR(年平均成長率)は25.5%の伸びを予測している。 アイ・ティ・アール(ITR

                  国内OCR市場は2023年まで年平均25.5%で成長、2023年度に160億円規模に─ITR | IT Leaders
                • 認識精度99%!AI-OCRソフト「DynaEye 11」が新発売

                  株式会社PFUが、認識精度と定義画面を大幅に強化したAI-OCRソフトウェア「DynaEye 11」を2022年7月8日(金)から販売開始します。 このAIニュースのポイント 認識精度と定義画面を大幅に強化したAI-OCRソフトウェアが新発売 従来は認識が困難であったケースでも高精度な認識が可能 確認・修正機能のみを切り出したライセンスの新規販売も開始 株式会社PFUは、大幅に機能をバージョンアップしたAI-OCRソフト「DynaEye 11」を新発売します。 今回のバージョンアップでは、AI-OCRの認識精度が大幅に強化され、96.1%から99.2%に向上しています。従来は認識が困難であった枠外にはみ出た記入にも対応しており、自治体での帳票記入時によくある斜めに傾いた記入や、書き損じによる取り消し線、文字上に押印が被るケースなどがあっても高精度な認識が可能です。 また、従来OCRの導入・

                    認識精度99%!AI-OCRソフト「DynaEye 11」が新発売
                  • 手書きの数式を撮影するだけでLaTeX形式へ変換してくれる数式専用OCRアプリ「Mathpix Snip」のMac版にペンタブレットやトラックパッドに対応した手書きモードが追加。

                    手書きや印刷された数式を撮影するだけでLaTeX形式へ変換してくれる「Mathpix Snipping Tool for Mac」がペンタブレットやトラックパッドに対応した新しいDrawing Modeを採用しています。詳細は以下から。 Mathpix Snipシリーズはスタンフォード大学でディープラーニングを専攻していたNico Jimenezさんが開発した数式に特化したOCRアプリで、写真やスクリーンショット内にある手書きや印刷された数式を抽出してLaTeX形式に変換してくれる機能がありますが、Mac版アプリとなる「Mathpix Snipping Tool」が最新のバージョン3.4アップデートで新しい手書きモード(Drawing Mode)を追加しています。 Mathpix Snipping Tool 3.4 What’s new: New drawing mode that is

                      手書きの数式を撮影するだけでLaTeX形式へ変換してくれる数式専用OCRアプリ「Mathpix Snip」のMac版にペンタブレットやトラックパッドに対応した手書きモードが追加。
                    • Tesseract OCR VS EasyOCR|猩々博士

                      はじめにAITuberとノベルゲームを共に楽しむために、ゲーム内のテキストを読み取り、AITuberが読み上げるシステムの構築を目指しています。 この記事では、Pythonで利用可能な複数のOCR(光学文字認識)ライブラリを試し、それぞれの認識精度と性能を比較してみました。 OCRライブラリの選定今回検証したライブラリは以下の通りです: Tesseract OCR: オープンソースで広く使われているOCRエンジン。 EasyOCR: ディープラーニングに基づく別の人気OCRツール。 認識テストに用いた画像テスト画像1: ゲームスクリーンショットをトリミングのみ実施 ドキドキ文芸部よりテスト画像2:画像1を画像処理したデータ 白ピクセル以外を塗りつぶし実装とテストPython環境でこれらのライブラリを実装し、同じノベルゲームのスクリーンショットを使ってテストを行いました。主な焦点は、認識精度

                        Tesseract OCR VS EasyOCR|猩々博士
                      • ダンプリストをOCR! - レトロパソコンであそぼう!

                        今も細々と開発中のダンプリスト入力ツール! pocketgriffon.hatenablog.comダンプリストも、基本的には手入力が好きな私。 OCRで文字認識をさせてみても、その間違いを探してどうせ256バイト全部見るくらいだったら、最初から手で打ち込んだ方が早いじゃん…と思ってしまってる。 2017年に一度だけOCRに挑戦してみたが、この時は4%くらいの間違いで済んでいた。このくらいの間違い率だったら使ってみても良いかな…と思っていたが、この当時使っていたタブレットのカメラが高性能だったのか、iPhoneに変えてからはだいぶ間違いが多い。 あの時は既存のツールを使うだけの方法だったけど、今回は認識率を上げるために自分で努力してみる事にした! どんなツールがある? 今までOCRのツールに何があるのかなんて気にした事もなかった…。 真っ先に出てきたのが、Google DriveによるOC

                          ダンプリストをOCR! - レトロパソコンであそぼう!
                        • OCRアプリの文字認識は本当に使えるのか?字が汚い私で試してみたw

                          手書きで書いたメモを簡単に読み込むことができたら、仕事がかなり効率化されますよね。もちろん印刷物も電子化すれば、分厚い書類の中から書類を探すということもなくなるので楽になるはず。また、例えば仕事で会議の議事録を取った時とか、今までの手書きのメモをデジタルで保存できるようになれば、「あのときのメモどこだったっけな?」と困らなくて済むでしょう。 そんな私も取材や仕事で上司から言われたことをメモすることが結構多いんですが、このメモを人に渡すと「なかなか読めない・・・」と言われることがしばしばありました。ってそれじゃメモの意味ないやないかーい! その字の汚さには定評があって、小学校の通知表には「字をキレイに書きましょう」といつも書かれました。そうなると苦痛だったことといえば、「ノートを提出してください」。

                            OCRアプリの文字認識は本当に使えるのか?字が汚い私で試してみたw
                          • 国立国会図書館「次世代デジタルライブラリー」のOCR結果について

                            地誌のはざまに 神奈川県を中心に、また江戸時代前後を中心に、その地誌を掘り返して話題を取り上げていく予定です。関連する自作、他作の動画なども取り上げます。 TOP ALL Entry RSS tweet Facebook Hatena blog LOGIN blog Making 11月8日に国立国会図書館からこの様なお知らせが発表されました。 実験サービス #次世代デジタルライブラリー に、OCRテキストを画像に重ねて表示する機能を追加しました。閲覧画面右上の「T」(矩形ごとにテキスト表示)ボタンをクリックすると、資料画像上のテキスト部分がハイライトされ、カーソルの位置のテキストが表示されるようになります。#NDL全文使ってみた pic.twitter.com/mFdkax9sk1 — 国立国会図書館 NDL (@NDLJP) November 8, 2022 「次世代デジタルライブラリ

                              国立国会図書館「次世代デジタルライブラリー」のOCR結果について
                            •  Gyazo ProのOCRで過去の画像を再発見する - T’s blog

                              GyazoをProにすると画像の中のテキストをスキャンするOCR機能が使えます。撮影したスクリーンショット内のテキストは自動で読み取り表示されます。OCR機能を使って画像をテキスト検索することもできます。 検索窓に探したい画像の中のテキストを入力するとGyazoにアップロードしてあるすべての画像から検索して表示されます。内容は・ユーザーの名前 ・アップロードした日時・引用したアプリケーション・キャプチャ元・OCR情報などです。 OCRスキャンは手書きの文字にも 不完全ながら対応していて検索することができます。 例えば「紺碧」で検索すると手書きで書いたメモの写真がヒットします。 画像の下にあるOCRで「すべて表示」をクリックして表示されたテキストはコピーして使うこともできます。 今まで直近の10枚しか閲覧できなかった画像もGyazo Proにするとすべてが閲覧検索の対象になり古い情報を再発見

                                 Gyazo ProのOCRで過去の画像を再発見する - T’s blog
                              • VRS対応OCR・バーコードリーダー|製品情報|Imager

                                さまざまなビジネス現場で利用実績のあるHoneywell製バーコードリーダーが、ワクチン接種記録システム・VRS・V-SYS・LGWANに対応しました。 新型コロナワクチン接種券に印刷された18桁の数字列を、ほぼ瞬時(0.1~0.2秒)に読み取ることが可能で、 タブレットアプリのOCRと比べ、読み取り作業時間の飛躍的な短縮が期待できます。 また今後対応が予定されているワクチン・パスポート(ワクチン接種証明書)の発行時に必要なパスポート旅券番号の読み取りにも対応し、LGWANでの使用も可能です

                                • 数式のスクリーンショットや写真をLaTeX形式に変換してくれるアプリ「Mathpix Snip」が日本語や中国、韓国、ロシア語などのOCRに対応。

                                  数式のスクリーンショットや写真をLaTeX形式に変換してくれるアプリ「Mathpix Snip」が日本語や中国、韓国、ロシア、ヒンディー語などのOCRに対応したそうです。詳細は以下から。 スクリーンショットや写真から数式をLaTeX形式へ変換してくれるツール「Mathpix Snip」シリーズを開発&公開している米Mathpix Inc.は現地時間2020年06月02日、同社がMathpix Snipシリーズに利用しているOCRエンジン「Mathpix OCR」をアップデートし、英語以外のテキストのOCRに対応したと発表しています。 Mathpxi OCRサポート言語 Hindi (Devanagiri) Korean (Hangeul) Mandarin (simplified + traditional) Vietnamese (Latin alphabet + accents) Ja

                                    数式のスクリーンショットや写真をLaTeX形式に変換してくれるアプリ「Mathpix Snip」が日本語や中国、韓国、ロシア語などのOCRに対応。
                                  • AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 | IT Leaders

                                    IT Leaders トップ > 経営課題一覧 > 業務改革 > 新製品・サービス > AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 業務改革 業務改革記事一覧へ [新製品・サービス] AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 2021年12月20日(月)日川 佳三(IT Leaders編集部) リスト AI insideは2021年12月20日、AI-OCRサービス「DX Suite」を強化したと発表した。読み取れる非定型帳票モデルを増やし、新たに保険加入時に発行する「保険証券」を読み取れるようにした。過去に販売した保険内容のデータベース化を支援する。こうしてデータベース化したデータは、新たなプランの提案などに役立つ。 DX Suiteは、クラウドサービス型のAI-OCR(光学文字認識)ソフト

                                      AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 | IT Leaders
                                    •  Keyboard MaestroでOCR - T’s blog

                                      OCRは印刷または手書きの文字を光学的に読み取る装置のことで紙の情報がいまだに使われるので利用されることもあります。今ならiPhoneでも簡単に読み取ることもできます。例によって Keyboard MaestroにもOCR機能があるというので試してみました。見よう見まねでマクロを組んでショートカットキーを押してはみたのだけれど結果は という30年以上前のOCRの程度でした。古い資料を参考にしたせいなのかエラーでした。多分Apple Scriptが間違っているのだろうけれど理解不能でお手上げです。 Keyboard Maestroが万能で便利そうだからといってあれもこれも手を出すと操作する人間の方のスキルがなくてパンクしそうです。今のところはスニペットやショートカットに絞って楽しんだ方が良さそうです。 See you tomorrow!

                                         Keyboard MaestroでOCR - T’s blog
                                      • AI契約審査クラウド「GVA assist」がOCRに対応 テキストデータのないPDFファイルの契約審査が可能に

                                        AI契約審査クラウド「GVA assist」がOCRに対応 テキストデータのないPDFファイルの契約審査が可能に 最終更新日:2022/08/08 GVA TECHが提供している、AI契約審査クラウド「GVA assist」にOCRが対応。GVA assistは、契約審査の「読む・直す・仕上げる」負担を軽くする契約審査補助ツールで、今回、テキストデータのないPDFファイルに対応できるようにOCR機能が実装されました。 このAIニュースのポイント GVA TECHのAI契約審査クラウド「GVA assist」にOCRが対応 PDFのテキストデータの有無にかかわらず、AIによる契約審査が可能 6月にファイル間での差分を比較表にする「文書比較機能」をリリース予定 GVA TECH株式会社は、AI契約審査クラウド「GVA assist」がOCRに対応したことをお知らせいたします。 GVA assi

                                          AI契約審査クラウド「GVA assist」がOCRに対応 テキストデータのないPDFファイルの契約審査が可能に
                                        • 画像から文字起こししてテキストに変換する(tesseract-OCR、pyocr)|ぷんたむの悟りの書

                                          画像から文字起こしができると、業務効率化など様々な場面に応用できて便利です。 幸いなことに、それを可能にするオープンツールがあります。しかもPythonで実行することができます。 ここでは各ツールを使って画像から文字起こしする具体的な方法とその手順についてまとめます。 まずはオープンツール(tesseract-OCR)の概要について まず、画像から文字起こしする技術を光学文字認識(Optical Character Recognition)といいます。略してOCRです。 OCRを実施できるソフトウェアに、Googleが開発元の「テッセラクト(tesseract)」というものがあります。「tesseract-OCR」とも呼ばれます。 tesseract-OCRはオープンソースです。誰でも使うことができます。 さらに、tesseract-OCRは画像のアップロードが不要です。一旦、ソフトウェア

                                          • Power Automate DesktopのOCR処理手順-新幹線領収書の事例|RPA導入・開発・運用ならCAC

                                            前回のコラムではWinActorEyeで新幹線領収書をOCRで読み取る検証をしてみました。「Microsoft Power Automate Desktopではどうなの?」という質問をいただいたので、同じように試してみました。 検証で使ったのは前回と同じ新幹線領収書。ここからOCRで金額・出発地・到着地等を取得し、結果をExcelに出力してみます。 Power Automate Desktop(Power Automate for desktop)とは 「Power Automate Desktop(Power Automate for desktop)」は、Microsoft 社が提供するRPA(業務自動化)ツールです。Windows 10ユーザーなら誰でも利用することができます。専門知識がなくても直感的に操作でき、無料で試せるのが特長です。有償版も提供されており、そちらではブラウザ操作

                                              Power Automate DesktopのOCR処理手順-新幹線領収書の事例|RPA導入・開発・運用ならCAC
                                            • 世界トップクラスの精度を誇るLINE独自開発のAI-OCRで「特定帳票」などバックオフィスの事務作業を大幅に効率化[Sponsored]

                                                世界トップクラスの精度を誇るLINE独自開発のAI-OCRで「特定帳票」などバックオフィスの事務作業を大幅に効率化[Sponsored]
                                              • Microsoft、「Computer Vision」のOCR機能で日本語など73言語をサポート

                                                Microsoft、「Computer Vision」のOCR機能で日本語など73言語をサポート:Azure Cognitive Servicesの改善 Microsoftの「Azure Cognitive Services」に含まれる「Computer Vision」のOCR機能が、日本語を含む73言語に対応した。複数ページあるドキュメントから選択ページに限ってテキストを抽出できる。

                                                  Microsoft、「Computer Vision」のOCR機能で日本語など73言語をサポート
                                                • Tesseract OCR 5.3.3 のインストールと動作確認(多言語の文字認識)(Windows 上)

                                                  【要約】 Tesseract OCR 5.3.3はWindows上での多言語文字認識ソフトウェアである.公式ページからインストール手順を確認し,必要な言語データをダウンロードして適切なディレクトリにインストールする.Windowsでの日本語文書読み取りには,画像を用意しコマンドプロンプトで指定コマンドを入力し,文字認識を行う.高解像度画像を使うことで、認識の精度が向上する傾向にあるようだ.以上がTesseract OCR 5.3.3のインストールと使い方の手順である. 【関連する外部ページ】 公式ページ: https://github.com/tesseract-ocr/tessdoc 【サイト内の関連ページ】 Tesseract OCR の使い方: 別ページ »にまとめ Ubuntu での Tesseract OCR のインストール: 別ページ »で説明 Tesseract OCR 5

                                                  • 【2021年版】Azure/GCP/AWS OCRサービス比較 - Qiita

                                                    はじめに 概要 AzureのOCR機能のレビュー記事を書いた際に、他のクラウドベンダーのOCRサービスとの比較についてお問合せ頂きました。 以下のレビュー記事です。 - AzureのOCR機能(Cognitive Service Read API v3.2)が日本語対応したので使ってみた 今回は、主要なパブリッククラウドであるAzure/GCP/AWSのOCRサービスについて比較してみましたので紹介したいと思います。 この記事の想定読者 クラウドが提供するOCR機能に興味のある方 どのクラウドサービスを導入しようか迷われている方 各社サービスの機能比較 Azure/GCP/AWSが提供するOCRサービスの比較を一覧表にまとめました。 ※2021/5/17時点で最新のバージョンを使用して検証しています。 対応言語数、価格ではAzureが一歩リードしているように思います。 対応ファイル数はGC

                                                      【2021年版】Azure/GCP/AWS OCRサービス比較 - Qiita
                                                    • PythonでOCR

                                                      概要 Googleが開発しているtesseractをpythonから呼び出してOCRをしてみる。 環境 Ubuntu 16.04 python 3.x pyocr tesseract 環境構築 pip install pyocr apt install tesseract-ocr libtesseract-dev tesseract-ocr-jpn 必要に応じてpip3にしたりsudoつけたり。 これによって入ってくるtesseractは古いもので精度が悪いことが予想されるので、きちんとやりたい場合はsourceからビルドして入れること。 とりあえず動かす import sys from PIL import Image import pyocr tools = pyocr.get_available_tools() assert(len(tools) != 0) tool = tools

                                                      • macOS 13 Ventura以降で日本語や韓国語などのOCRをサポートし、メニューバーアイコンへのドラッグ&ドロップにも対応したOCRアプリ「TRex v1.6.0」がリリース。

                                                        macOS 13 Ventura以降で日本語や韓国語などのOCRをサポートし、メニューバーアイコンへのドラッグ&ドロップにも対応したOCRアプリ「TRex v1.6.0」がリリースされています。詳細は以下から。 TRexはAmeba LabsのAlex Mazanovさんがオープンソースで開発しているMac用OCRアプリで、AppleのVisionフレームワークを利用し、オフライン&オンデバイス上でキャプチャした画像内にあるテキストを認識、文字としてペーストできるようにしくれますが、現地時間2022年11月22日付で新たに「TRex v1.6.0」アップデートがリリースされています。 macOS Ventura support, including new laguages: Japanes, Korean, Ukranian and Russian リリースノートより抜粋 TRex v1

                                                          macOS 13 Ventura以降で日本語や韓国語などのOCRをサポートし、メニューバーアイコンへのドラッグ&ドロップにも対応したOCRアプリ「TRex v1.6.0」がリリース。
                                                        • LINE WORKS OCR - LINE WORKS

                                                          再春館システム株式会社1日7,000枚超のメモをペーパーレス化 &リピーター9割以上の顧客満足度を両 立する自社コールセンター。

                                                            LINE WORKS OCR - LINE WORKS
                                                          • 【2024年版】無料オープンソースのOCRソフトウェア10選を徹底比較!(PDFや画像からテキスト情報を抽出)

                                                            企業内ではテキストデータのみならず、さまざまなバイナリデータがやり取りされます。良くあるのはPDFの帳票です。そうしたデータの中から必要な数字、テキストを抽出する際に便利なのがOCRです。 OCRを使うことで、PDFや画像からテキストが抽出できます。システム自動化を考える際に役立つので、覚えておきましょう。 macOCR macOS向けのコマンドで、任意の範囲を指定してテキストデータを抽出します。抽出されたテキストは標準出力の他、クリップボードにもコピーされます。 範囲の選択時にはマウスを利用するので、見た目にもわかりやすいですし、画像の一部からテキストを抜き出すのにも利用できます。 schappim/macOCR: Get any text on your screen into your clipboard. Tesseract OCR Tesseract OCRはGoogleが公開し

                                                              【2024年版】無料オープンソースのOCRソフトウェア10選を徹底比較!(PDFや画像からテキスト情報を抽出)
                                                            • tesseract OCRでエンド・ツー・エンドのソリューションを構築する - Qiita

                                                              はじめに この記事では、tesseractというオープンソースのOCRエンジンで文字を認識するにあたって必要となる、前処理から後処理までの一連の流れをエンド・ツー・エンドで実際のコードをベースに説明してみたいと思います。一番大事なことは今から使うOCRエンジンが認識しやすいイメージを準備することです。 この試行錯誤を始めた当初は悲惨でした。綺麗に背景除去できたと喜んで100件読ませると、全桁正解できたのは50件くらいで残る半分は1文字か2文字は誤読しているという状態で、今思うと、OCRエンジンにとって好ましいイメージというものがわかっていなかったと思います。分からないからこそ、OCR自身に「これは?」「あれは?」と何万回も聞くようにして背景除去のパラメーターを決めるようにしました。それからは、精度が目に見えて上がるようになったので、人の目でみて判断するのではなく実際にOCRにパラメーターの

                                                                tesseract OCRでエンド・ツー・エンドのソリューションを構築する - Qiita
                                                              • Flutter + ML Kitを使ってオフラインで動く日本語OCRアプリを作る

                                                                はじめに これまで画像から日本語のテキスト認識(OCR)の機能を実現する場合は、GoogleのCloud Vision APIなどを利用していました。 この方法の問題として、テキスト認識を行いたい画像を一度サーバー側へアップロードする必要があり、解析結果を取得するまでにある程度は時間がかかってしまうことでした。さらにCloud Vision APIの場合は料金が発生してしまいます。 しかし、Googleが公開しているML Kitの中の一つであるText Recognition v2(Beta)では日本語がサポートされ、デバイス上のみで日本語のテキスト認識処理を完結できるようになりました。 今回はML Kit Text Recognition v2を導入してFlutterアプリでテキスト認識機能を実現したいと思います。 環境 Flutter 3.3.5 プロジェクト作成 $ flutter

                                                                  Flutter + ML Kitを使ってオフラインで動く日本語OCRアプリを作る
                                                                • NTTデータ、地方公共団体にAI-OCRやRPAのサービスを無償提供

                                                                  印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます NTTデータは5月1日、新型コロナウイルスの感染拡大に伴う「特別定額給付金」の支給業務を行う地方公共団体に向けて、紙の資料をデジタル化するAI-OCR(人工知能を活用した光学文字認識)サービス「NaNaTsu AI-OCR with DX Suite」、RPA(ロボティックプロセスオートメーション)ツール「WinActor」、WinActor に関するeラーニングについて無償提供すると発表した。期間は給付金の支給期間である5月1日~7月31日で、6月30日まで利用申し込みを受け付ける。 NaNaTsu AI-OCR with DX Suiteは、LGWAN-ASPが利用可能な地方公共団体向けのサービス。LGWAN-ASPでは、安全性が高

                                                                    NTTデータ、地方公共団体にAI-OCRやRPAのサービスを無償提供
                                                                  • 非定型 AI-OCR 作ってみた 〜 AI 時代の開発戦略を添えて

                                                                    シンプルフォーム CTO の小間 (@hkomachi) です。 本記事は SimpleForm Advent Calendar 2023 の2日目です。 大 AI 時代の技術開発戦略 最近の AI 技術革命により、ChatGPT に代表される LLM(Large Language Model: 大規模言語モデル)が普及し、いわゆる AI の民主化が進んでいます。これにより、機械学習についての低レイヤーな知見がなくても世界最高レベルの AI を活用した機能の開発や PoC を迅速に推進できるようになりました。先日の OpenAI DevDay と Microsoft Ignite での発表も衝撃的であり、AI による可能性が日々急速に広がっています。 このようなジェットコースターに乗っているかのような急速な時代変化の中で、私達が取ろうとしている技術開発戦略は大きく3つあります。 戦略 Ⅰ

                                                                      非定型 AI-OCR 作ってみた 〜 AI 時代の開発戦略を添えて
                                                                    • Web雑誌「AI-OCR業界別事例集」を無料配布! | DXを推進するAIポータルメディア「AIsmiley」

                                                                      AIポータルメディア「AIsmiley」は、業界別にAI-OCRソリューションの活用事例をまとめた「AI-OCR業界別事例集」を公開します。手書き文字の自動読み取り、紙帳票の仕分け、請求書データの入力自動化など事例を踏まえ人気AI企業5社が紹介します。 AI-OCRとは? 従来の OCR は、あらかじめ想定していた文字しか認識できないため、そこから大きくはずれたクセのある文字は認識できませんでした。OCR に AI を取り入れたことによって、手書き文字はクセを学習させ読み取り精度を向上させることができ、非定型帳票の読み取りも可能になりました。OCR で帳票を読み取る場合、あらかじめ「この項目は氏名、その下は住所……」というように、帳票の項目を指定しておかなくてはなりません。 AI-OCRであれば、読み取った情報をもとにAIが自動的に内容を識別できるため、読み取る帳票の幅が広がります。ビジネ

                                                                      • 検索可能になっていないPDFを、ScanSnap付属アプリでOCR処理をして検索可能なPDFにする方法(ScanSnapでスキャンした1ページのPDFにJPGとして追加してからOCR処理する)

                                                                        検索可能になっていないPDFを、ScanSnap付属アプリでOCR処理をして検索可能なPDFにする方法(ScanSnapでスキャンした1ページのPDFにJPGとして追加してからOCR処理する) 前提 Mac MacBook Pro macOS Big Sur ScanSnap 富士通 PFU ドキュメントスキャナー ScanSnap iX1600 (ホワイト/両面読取/ADF/4.3インチタッチパネル/Wi-Fi対応) - Amazon.co.jp 問題 検索可能になっていないPDF(ScanSnap以外で作成された画像のみのPDF)は、そのままではScanSnap付属アプリでOCR処理できない。 解法 ScanSnapでスキャンした1ページのPDFを用意しておき、そこにOCR処理したい全ページをJPGとして挿入したPDFを作ってから、それをOCR処理すればいい。 手順 ScanSnapで

                                                                          検索可能になっていないPDFを、ScanSnap付属アプリでOCR処理をして検索可能なPDFにする方法(ScanSnapでスキャンした1ページのPDFにJPGとして追加してからOCR処理する)

                                                                        新着記事