並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 424件

新着順 人気順

OCRの検索結果321 - 360 件 / 424件

  • tesseractを試しに使って手書き文字(日本語)の認識精度を確認してみた。 - Qiita

    はじめに オライリーのスクレイピングの本を読んでいた時、Tesseract について少し説明があった。 入手可能なオープンソースOCRの中で "最良で最も正確" と書かれていたため、どのくらいの精度が出るものなのか試しに確認してみたので、その時の内容をメモとして残す。 前提条件 【PC環境】 Windows 10 Pro 【SW or Packageのバージョン】 tesseract 5.2.0 Python 3.9.13 pyocr 0.8.3 OpenCV 4.6.0.66 メモ内容 1.Tesseract・pyocr のセットアップ。 2.いくつかの画像パターンで認識精度を確認してみる。 1.Tesseract・pyocr のセットアップ Tesseract のセットアップ 以下のサイトより、Tesseract のインストーラーをダウンロードする。 ※インストールの際にコンポーネント

      tesseractを試しに使って手書き文字(日本語)の認識精度を確認してみた。 - Qiita
    • Cogent Labs、AI-OCR「SmartRead」を発表、文字認識に加えて文書の仕分けが可能に | IT Leaders

      IT Leaders トップ > テクノロジー一覧 > アプリケーション > 新製品・サービス > Cogent Labs、AI-OCR「SmartRead」を発表、文字認識に加えて文書の仕分けが可能に アプリケーション アプリケーション記事一覧へ [新製品・サービス] Cogent Labs、AI-OCR「SmartRead」を発表、文字認識に加えて文書の仕分けが可能に 紙文書からデータを抽出する処理の全体をカバー 2021年10月27日(水)日川 佳三(IT Leaders編集部) リスト Cogent Labsは2021年10月26日、AI-OCRサービス「SmartRead」を発表した。同年12月から提供する。既存のAI-OCRサービス「Tegaki」の機能上位版にあたり、手書き文字と活字の読み取りに加えて、文書を分類して仕分ける機能を追加している。紙文書からデータを抽出する処理の

        Cogent Labs、AI-OCR「SmartRead」を発表、文字認識に加えて文書の仕分けが可能に | IT Leaders
      • Google Drive APIを用いたOCRと出力内容の自動転記方法例

        本記事の目的 企業での事務作業において、PDFの内容を転記して他の資料への転記する作業やPDFの内容を会社の独自システムにアップロードする作業が存在します。アップロードの際は、初めから読取を考えていた場合は、転記等の作業は必要ありませんが、現状は異なる書式への転記作業が必要になる場合も存在する可能性もあります。これらの単純作業は、高精度なOCRを実装により削減が可能です。このOCRの実装を自社で行うことで他企業への開発依頼をしないという選択肢も取れるのではないかと考えました。またOCRの実装を自分で行うことにより、フォーマット変更時の対応や読み取った内容の分析に関して、自社で行うことも可能ではないかと考えています。 そのための最初のステップとして、OCRの実装と出力内容を見ていきます。なお、今回はGoogle DriveのOCRを実装していきます。 今回実装するOCR OCRはOptica

          Google Drive APIを用いたOCRと出力内容の自動転記方法例
        • Program List OCR 1.0.0リリース!: 808 Midway

          PC-6001互換CGROM Ver.1.1 by 松岡 (04/03) 雑誌掲載作品レビュー(21)「Caffo」 by eighttails (04/03) PC-6001互換CGROM Ver.1.1 by eighttails (04/03) PC-6001互換CGROM Ver.1.1 by 松岡 (04/03) 雑誌掲載作品レビュー(21)「Caffo」 by 生駒 (03/19)

          • Textractor

            • Google ColabでTesseractOCRを使う方法 - Qiita

              はじめに Google ColaboratoryでTesseractOCRを使う方法についてまとめました。 目次 はじめに 目次 OCRとは TesseractOCRとは 実装 参考文献 OCRとは OCR(オーシーアール)とは、Optical character recognitionの略で、光学文字認識と訳されます。 OCRは、活字や手書きの文字の画像を、テキスト情報に変換する技術です。 文字が記載された画像、例えば名刺やレシート、免許証をはじめとする身分証明書、請求書といった画像を読み取って文字データに変換します。 これにより、従来人が目で見て手入力していた作業を大幅に削減することができ、人件費の削減や業務効率化につながっています。 現在、OCRを使用した様々なサービスが提供され、OCR各社の読み取り精度も日々向上しています。 TesseractOCRとは Tesseract (テッ

                Google ColabでTesseractOCRを使う方法 - Qiita
              • tesseractでOCR@Windows7 - Qiita

                Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you can do with signing up

                  tesseractでOCR@Windows7 - Qiita
                • NDLラボ

                  NDLラボの概要と研究成果のご紹介 NDLラボの目的や、NDLラボで研究開発を行っている技術に関する文献をご紹介します。

                  • 【2022.8月修正】Google Apps Scriptでトリガー実行(doGet,doPost)のログを表示するにはGCPプロジェクトに紐付ける必要があるらしい

                    しかし、Webアプリケーションで使う doGet や doPost のように外部からのGETリクエストやPOSTリクエストで起動した関数内でログを書き出しても、エディタ画面では見られません。 ややこしいことに同じdoGet、doPostでもエディタ内のデバック機能で実行するとログが見られます。外部からのアクセスで動いた時にはログが残りません。 GET、POSTでアクセスしたときにパラメーターがちゃんと渡っているかとか調べたいときとかに困るんですよね。 ちょっと検索するとLogger.log()じゃなくて console.log()を使うと良いという情報が出てきます。ところが、console.log()を使ってもやっぱり残らない。 なんか昔はconsole.logでできていたような気もするんですが。そういえば以前はStackDriverでログをなんちゃらかんちゃらという話がありました。新エデ

                      【2022.8月修正】Google Apps Scriptでトリガー実行(doGet,doPost)のログを表示するにはGCPプロジェクトに紐付ける必要があるらしい
                    • ML Kit を使用して画像内のテキストを認識する(iOS)  |  ML Kit for Firebase

                      フィードバックを送信 ML Kit を使用して画像内のテキストを認識する(iOS) コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。 ML Kit を使用すると、画像内のテキストを認識できます。ML Kit には、画像内テキスト(道路標識のテキストなど)の認識に適した汎用 API と、ドキュメント内テキストの認識に最適化された API があります。汎用 API には、デバイスモデルとクラウドベース モデルの 2 つがあります。ドキュメント テキスト認識はクラウドベース モデルでのみ使用できます。クラウドモデルとデバイスモデルの比較については、概要をご覧ください。 始める前に まだアプリに Firebase を追加していない場合は、スタートガイドの手順に沿って追加してください。 ML Kit ライブラリを Podfile に含めます: pod 'Firebas

                      • DocLLM: A layout-aware generative language model for multimodal document understanding

                        Enterprise documents such as forms, invoices, receipts, reports, contracts, and other similar records, often carry rich semantics at the intersection of textual and spatial modalities. The visual cues offered by their complex layouts play a crucial role in comprehending these documents effectively. In this paper, we present DocLLM, a lightweight extension to traditional large language models (LLMs

                        • AI-OCRの主要11製品を比較!多様な機能や精度、価格の違いを解説

                          AI OCR技術の導入により、紙書類の保管スペース不足や検索の手間などの悩みが大幅に改善されました。 今日、AIを組み合わせたOCR技術は、その精度と効率を大幅に向上させています。しかし、AI OCRは、ツールによって強みとしている機能が違います。 そこで、今回は以下の内容に沿ってAI OCRについて解説します。 AI-OCRの選び方ポイント 手書き文字・印字に強いおすすめAI-OCR 手書き文字に強いAI-OCR 印字に強いおすすめAI-OCR AI-OCRについて詳しく知りたい方は以下の記事もご覧ください。 AI-OCRとは?種類や事例、メリットなど比較ポイントを解説 AI-OCRのサービス・企業の一覧ページ AI-OCRの選び方ポイント では、実際にAI-OCRの導入を検討する場合、どのようなポイントに着目して選べば良いのでしょうか。ここからは、AI-OCRを選ぶときのポイントについ

                            AI-OCRの主要11製品を比較!多様な機能や精度、価格の違いを解説
                          • OCR フリー - オンラインに画像から文字を抽出

                            光学式文字認識(OCR)は画像 テキスト 抽出.ドキュメント、本、キャプチャされた画像、PDFをスキャンします。 ocr オンラインコンバーターは、画像から文字を抽出し、それらを単語に変換してから、単語を文に変換します。これにより、元のコンテンツを編集するためのアクセスが可能になります。 画像 テキスト化人工知能(AI)を利用して、言語や手書きのスタイルを識別するなど、より高度な文字認識方法を実装できます。 手作業でデータを入力する必要がありません。 これが、書面による作業の理由です画像から文字を読み取る サイト必要です 私たちのocr オンラインコンバーターは、画像からテキストを検出するのに最適です。いくつかの画像 テキスト機能を見てみましょう: AIベースの抽出 高度なアルゴリズムを使用して画像から文字を抽出100%の精度で。抽出プロセスは、画像の品質によって異なります。あなたの画質が

                              OCR フリー - オンラインに画像から文字を抽出
                            • 【TIPS】簡単&高性能!写真や画面キャプチャの文字起こしをする方法 | ひとぅブログ

                              写真の文字や画面キャプチャをした画像に書かれた文字をテキスト化したい場合、いろんな手段がありますが、最も簡単で高性能な方法がようやく見つかりましたのでご紹介します。 今回ご紹介する方法はパソコンを使用します。スマホの場合はOCRアプリを利用する方法がありますが、精度の問題などから今回は見送りました。 それでは行ってみましょう!! 文字起こしは意外とハードルが高い 実際にやってみると分りますが、サクッと文字起こしをするのは意外と難しいです。PDFの画像をテキスト化したり、OCRソフトを利用したり、すでに色んな機能やソフトは存在するのですが、テキスト化率が悪かったり、思った場所がテキスト化の範囲にならなかったり。 そんな中、やはりGoogle先生はすごかった。と感服しました。 今回は、GoogleドライブとGoogleドキュメントを利用します。 まず、サンプルの画像から。以下の案内文章を文字起

                                【TIPS】簡単&高性能!写真や画面キャプチャの文字起こしをする方法 | ひとぅブログ
                              • GitHub - zacharywhitley/awesome-ocr

                                jdeskew (paper:2022) - Adaptive Radial Projection on Fourier Magnitude Spectrum for Document Image Skew Estimation DewarpNet (paper:2019) MORAN_v2 (paper:2019) - A Multi-Object Rectified Attention Network for Scene Text Recognition thomasjhaung/deep-learning-for-document-dewarping unproject_text - Perspective recovery of text using transformed ellipses unpaper - a post-processing tool for scanned

                                  GitHub - zacharywhitley/awesome-ocr
                                • Home

                                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                    Home
                                  • C#で英語ゲームのスクリーンショットからOCRと翻訳を行う - Qiita

                                    はじめに この記事はゲーム The Elder Scrolls シリーズの1作目である Arena を何とか日本語で遊べるようにしようとする試みの中で、主だった技術部分のコードを備忘録として残すためのものです。 いきさつなどの詳細ははてなブログの記事にて記載しております。 The Elder Scrolls: Arena の日本語化 - 1 - プログラミング・動画編集 備忘録 なお、環境や作成するツールの形態は次の通りです。 Windows 7 Microsoft Visual Studio Community 2019 Version 16.6.3 Windows フォーム アプリケーション(.NET Framework) .NET Framework 4.7.2 また、現時点での翻訳精度などは同じくはてなブログの次の記事に記載しております。 The Elder Scrolls: Ar

                                      C#で英語ゲームのスクリーンショットからOCRと翻訳を行う - Qiita
                                    • iOS/iPadOS 15からの新機能でTaobao/Tmallでの買い物を(少し)楽にする|のらねこノート

                                      ※この記事は、過去に書いた Taobao(Tmall)で予約商品を買うときの手順 の補助的な内容。 今回紹介するのは、最近更新されたiOS/iPadOS 15で追加された新しい機能『Live Text』。これを使えばTaobao/Tmallでの買い物が便利になるかも、という趣旨の記事を書いていきたい。 ・なぜ便利? TaobaoやTmallでは、なぜか商品説明が画像になっていることが多い。理由は知らないが……例として、原神の刻晴1/7フィギュアの説明文を挙げる。 普通は画像に表示されているテキストをコピーすることはできないため、これのおかげで画像に書いてある文章が分からなくても、翻訳することが不可能だった(実際のところ、Google Driveに画像を保存し"ドキュメント"に読み込ませればできないことはなかったけど、普通にめんどくさい)。しかし、今回iOS/iPadOS 15に追加された新

                                        iOS/iPadOS 15からの新機能でTaobao/Tmallでの買い物を(少し)楽にする|のらねこノート
                                      • 雑誌掲載リストの打ち込みを攻略? - レトロゲーム攻略

                                        コメントでのtaktakgkさんから、ログイン1986年5月号にプログラムリストが掲載されたレースゲームの「F」を見たいというリクエストがありました。実は、沢山古い雑誌を持っている者の、プログラムリストの打ち込みをしたことは無かったです。もちろん、「いつかはやりたい」という気持ちは強く、5大誌と呼ばれる1.ベーマガ 2.ログイン 3.ポプコム 4.テクノポリス 5.コンプティーク の他にも、I/O、マイコン、PCマガジン、PiO、プログラムポシェット、、などの雑誌を多数持っています。 ベーマガやログインは創刊号~1990年ごろまではほぼ全冊あると思います。 本棚に入りきらない雑誌たち 他にも1982年ごろからのI/O、コンプティークは1985年以降がほぼ全冊。遊撃手。意外と電波新聞社のゲームリストが掲載されていた月刊マイコン。アソコンとかチャレアベなどの必勝本ですかね。 もちろん、今は1か

                                          雑誌掲載リストの打ち込みを攻略? - レトロゲーム攻略
                                        • eKYCとは?犯収法対応のオンライン本人確認で業務改善 - 株式会社ダブルスタンダード

                                          eKYCサービス 信頼性の高いセキュリティで 本人確認を安全に 豊富な機能で、理想のeKYCをカスタマイズ

                                          • 駐車場のタイムズ「レシートをインボイス対応するの面倒だな…せや!」→対処法が斬新すぎるww

                                              駐車場のタイムズ「レシートをインボイス対応するの面倒だな…せや!」→対処法が斬新すぎるww
                                            • 【インタビュー記事】オートメーションラボ 村山社長 請求書100枚をたった3分で処理するAI-OCRでバックオフィス革命! | DXを推進するAIポータルメディア「AIsmiley」

                                              人事、経理、法務など会社を運営するためには欠かせないバックオフィス業務。 例えば、経理部門は月末に一斉に送られてくる請求書の処理に追われて残業したり、短い期間で処理するために多くのスタッフをアサインしたり、業務を外部に委託したりするケースも少なくありません。請求書業務の改善で注目を集めてきたOCR技術ですが、これまでのOCRサービスは、読み込ませる請求書すべての帳票定義をしなくてはならないという大きな課題がありました。 そんな中、バラバラな請求書でも読めて、自動で統一されたフォーマットにデータ化してくれるAI-OCRサービスが登場しています。 今回は請求書の会計処理をAIで自動化し、100枚を3分で処理するプロダクト「sweeep」を提供するオートメーションラボ株式会社 代表取締役の村山 毅氏にお話を聞きました。 村山 毅 オートメーションラボ株式会社 代表取締役 Founder/CEO

                                                【インタビュー記事】オートメーションラボ 村山社長 請求書100枚をたった3分で処理するAI-OCRでバックオフィス革命! | DXを推進するAIポータルメディア「AIsmiley」
                                              • 文字認識:tesseract-ocrをインストールしてみた : 真面目系クズのじんせい

                                                時代の波には乗れていないのかもしれないが、いまさらtesseract-ocrを使ってみました。本当はいろいろなものを試してみたい感はあるのですが、google先生以上のものはないと信じて、tesseract-ocrでいってみます。 とりあえず、tesseract-ocrをダウンロード。 github.com Makeとかそういうのは、ちょっとぼくにははやすぎるんで、以下の方法でWindows環境の実行ファイルを取得しました。 tessera-ocrのダウンロード 上記リンク先から、Installing Tesseract項 「Install Tesseract via pre-built binary package」 をクリック Windows項 「Tesseract at UB Mannheim」 をクリック Tesseract at UB Mannheim項 「tesseract-o

                                                  文字認識:tesseract-ocrをインストールしてみた : 真面目系クズのじんせい
                                                • Unityでtesseract-4.1.0を使う - Qiita

                                                  ネット上にいくつかtesseractをUnityに導入する記事はあるものの、想像以上に手こずってしまったので備忘録も兼ねて記事にします。 今回使用した環境はWindowsなので、その他の環境では同じ方法でも動かない可能性があります、ご了承ください。 そもそもtesseractって? tesseractとはOCR(Optical Character Recognition、光学文字認識)と呼ばれる画像から文字を認識するためのライブラリの一つで、Apache License 2.0 の下で配布されています。 基本的に内部の言語はC++で書かれているため、Unity上で利用するためにはこれをC#から呼び出せるようにしなければなりません。そこで今回利用したのがDllImport属性です。 DllImport属性を用いるとC#から.dllファイル内の関数を呼び出すことができます。つまり、tesser

                                                    Unityでtesseract-4.1.0を使う - Qiita
                                                  • Mokuro(Manga-OCR)漫画画像の文字認識・HTML出力を試す Windowsで動かす方法解説

                                                    これらをインストール&パスの通った状態にします。 仮想環境作成 適当なフォルダを作成し、フォルダ内で右クリック→「ターミナルで開く」を選択。 フォルダ内にPyhtonの仮想環境を構築します。 以下のコマンドをコピペして実行しましょう。 python -m venv venv venv\Scripts\activate.ps1 警告は気にせず貼り付けてください。 これで仮想環境が作成できました。 必要なモジュールをインストール ターミナルに以下のコマンドを入力してください。 pip3 install mokuro 2,Mokuroを動かす方法&実力を実演してみる Mokuroを動かす方法 ターミナルに以下のように、漫画の画像が何枚も入っているフォルダを指定したコマンドを打ちます。 mokuro D:\test\manga-image-pass こんな感じです。 あとはフォルダ内を1つのHTM

                                                    • Tesseract OCR バージョン5.0.0をインストールする(Windows10)

                                                      Tesseract OCR バージョン5.0.0をインストールする(Windows10) Tesseractとは、オープンソースのコードを持つ光学式文字認識エンジンです。もともとは、1980年代にコンピューターと電子計測機器の製造、販売を行っているアメリカ合衆国の有名企業であるヒューレット・パッカードによってプロプライエタリソフトウェアとして開発されたものです。2005年にオープンソースとしてリリースされ、2006年からGoogleが開発を後援しています。なお、Tesseract OCRの主な用途は、写真から領収書を認識することでした。 Tesseractは、最も人気のある定性的OCR(Optical Character Recognition/Reader、光学的文字認識)ライブラリです。 OCRは文字検索と画像認識に人工知能を用いてます。 ■PC環境・Windows10 ■ダウンロード

                                                        Tesseract OCR バージョン5.0.0をインストールする(Windows10)
                                                      • <OCR, tesseract, python> 光学的文字認識をやってみた。 - ねこゆきのメモ

                                                        諸事情により、画像imageから、テキストを抽出をやってみた。 光学的文字認識Optical Character Recognitionというらしい。 自分の土俵でできるか、、だったが、幸いにmsys2版があった。ラッキー。 で、必要なソフトのインストールからスタート。 このWikiに従う。 Home · tesseract-ocr/tesseract Wiki · GitHub >pacman -S mingw-w64-{i686,x86_64}-tesseract-ocr >pacman -S mingw-w64-{i686,x86_64}-tesseract-data-eng mingw64を使ってこなかったが、ここで、大量にインストールが発生。 まあ、しょうがないので、進める。Go。 次。pythonのパッケージのインストール。 >conda install pillow >pip

                                                          <OCR, tesseract, python> 光学的文字認識をやってみた。 - ねこゆきのメモ
                                                        • Googleドライブに保存した画像のテキストは、OCRで文字起こしができることをご存知ですか? | iSchool合同会社

                                                          今日のエントリーは、Googleドライブに保存した画像のテキストをOCRで文字起こしする方法を紹介します。 紙データを見ながら文字起こしをするには面倒ですよね? そんなときはGoogleドライブを使えば解決します。 例えば、紙で作成されたビジネス書類の写真をGoogleドライブへアップすれば、画像内のテキストをOCRで文字起こしができるので、簡単にデータ化できます。 すごく便利な機能なのですが、結構知らないユーザーもいますので、やり方を紹介します。 GoogleドライブのOCRを使うメリット GoogleドライブのOCRの文字認識率は高いので (個人的な感覚では98%以上の精度)、次のようなメリットがあります。 紙の文書のデータ化が簡単にできる 画像の中から文字を抽出できる 手書きの文書もデータ化できる これは使ってみたくなりませんか? Googleドライブにアップできるファイル形式は?

                                                            Googleドライブに保存した画像のテキストは、OCRで文字起こしができることをご存知ですか? | iSchool合同会社
                                                          • GASとDrive APIを組み合わせて画像やPDFファイルをOCR処理する方法 | 勉強したことのメモ

                                                            Googleドライブに保存した画像やPDFファイルをOCR処理し、ファイル内のテキストを抽出したい。良い方法は無いか調べてみるとGoogle Apps ScriptとDrive APIを組み合わせることで簡単に実装できる模様。以下に実装方法をメモ。 Google Drive APIについてリファレンス等は以下公式サイトより確認できる。 https://developers.google.com/drive/api/reference/rest/v3?hl=ja 実装方法Drive APIの準備Googleスプレッドシートを開き「拡張機能→Apps Script」をクリックする。ページ左側の「サービス+」をクリックし「Drive API」を追加する。注意点としてバージョンは2を選択すること(3だと後述のソースコードではエラーになった)。 ファイルの準備GoogleDriveに画像やPDFをア

                                                              GASとDrive APIを組み合わせて画像やPDFファイルをOCR処理する方法 | 勉強したことのメモ
                                                            • Windows Native C++でWinRTのOCR APIを使う方法 - Qiita

                                                              はじめに こんにちは。Daddy's Officeの市川です。 私が10年以上開発を続けているWindowsPCを監視カメラシステムにする「LiveCapture3」。 先日、このソフトにOCR機能を追加して、カメラ映像内の数値を検出できるようにしました。 (この機能により、サーマルカメラを使用した自動温度計測&通知システムの構築が可能です) 「LiveCapture3」のコア機能はC++で実装しているので、C++でOCR機能を実装する必要がありました。 C++でのOCRといえば、「Tesseract」が有名ですが、今回は画像内の数値のみ検出すればよく、そこまで大掛かりにしたくありませんでした。 そこでWindowsのAPIを調べたところ、ありました! Windows.Media.Ocr しかし、よくよく見てみると、これはWinRTっぽい感じ。 つまり、UWPアプリやストアアプリであれば使

                                                                Windows Native C++でWinRTのOCR APIを使う方法 - Qiita
                                                              • 書籍からの原稿起こし業務(200,000文字程度)

                                                                案件名:書籍からの原稿起こし業務 概要:企業様からの書籍の原稿起こし依頼 数量:200,000文字程度(約290ページ) 単価:一文字あたり0.5円 ご請求費用(めやす):100,000円 広告代理店様よりご相談いただき、書籍の原稿起こし(活字)及び検品作業(システムチェック・目視チェック)をお預かりより納期2週間程度で、Excel形式にて納品いたしました。

                                                                • 【Japan IT Week 関西 2020】AI・業務自動化展で気になった企業・サービスのレポート第2弾

                                                                  前回に引き続き、先週1月29日~31日に大阪インテックスで開催された第3回「AI・業務自動化展」で気になった企業・商品のレポートをお届けいたします。 簡単高機能!小ロットに強いOCR 〇出展企業:アクセス・アイ株式会社 〇AIプロダクト名:アクセス AI OCR 最初にご紹介するのは、地元・大阪の企業であるアクセス・アイ社。ブースに来られている多くの方が画面を食い入るように見ていたのが「アクセス AI OCR」というシステムです。 「アクセス AI OCR」は、その名の通り、AI(人工知能)とOCR(光学文字認識)を掛け合わせたもので、受発注書、納品書、請求書など、人が帳票を見ながらデータ入力してきた業務をスキャンを行うだけで後処理はAIに代替してもらおうという画期的なシステムです。 ※OCRは、Optical Charcter Recognitionの略。文書等をスキャナーで読み込み、記

                                                                    【Japan IT Week 関西 2020】AI・業務自動化展で気になった企業・サービスのレポート第2弾
                                                                  • Mathpix Snipの機能をターミナルから実行できるコマンドラインツール「mpx-cli」を利用してPDFファイルの科学技術論文を編集可能なMarkdownやDocxファイルへ変換する方法。

                                                                    数式専用OCR「Mathpix Snip」の機能をターミナルから実行できるコマンドラインツール「mpx cli」を利用してPDFファイルをMarkdownやDocxファイルへ変換する方法です。詳細は以下から。 Mathpix Snipシリーズはスタンフォード大学でディープラーニングを専攻していたNico Jimenezさんが開発した数式に特化したOCRアプリで、写真やスクリーンショット内にある手書きや印刷された数式を抽出してLaTeX形式に変換してくれる機能の他に、2021年06月にはPDFファイルを丸ごとMarkdownやMicrosoft WordのDocx、LaTeXファイルへ変換してくれる機能をWeb版の「Snip Notes」に実装しましたが、 現地時間2021年10月05日に公開されたブログの記事を読んでいたところ、この機能はWeb版のSnip Notesだけではなく、Macや

                                                                      Mathpix Snipの機能をターミナルから実行できるコマンドラインツール「mpx-cli」を利用してPDFファイルの科学技術論文を編集可能なMarkdownやDocxファイルへ変換する方法。
                                                                    • gDriveOCR - Google Driveを使ったOCR

                                                                      MOONGIFTはオープンソース・ソフトウェアを紹介するブログです。2021年07月16日で更新停止しました OCRは大抵スキャナなどに備わっています。オープンソースのOCRもあることはあるのですが、品質はあまり高くありません。画像の中から効率的に情報を取り出す方法は手間がかかるイメージがあります。紙文書からテキストデータを取り出すのに苦労した人も多いでしょう。 今回紹介するgDriveOCRはスマートな解決手法になるそうです。OCRとしてGoogle Driveを使います。 gDriveOCRの使い方 たとえば次のようなコマンドを打ちます。日本語も指定可能です。 gdriveocr moongift.png 実行後、Wordファイルがダウンロードされます。元の画像と、そのOCR結果が表示されます。 gDriveOCRはGoogle DriveのOCR機能を使って、コマンドでファイルをアッ

                                                                        gDriveOCR - Google Driveを使ったOCR
                                                                      • 保険見積もりの時間を大幅に短縮する 「NTTイフのカシャ!比較見積もり」(愛称:カシャみつ)を開始 | InsurTechJapan

                                                                        保険見積もりの時間を大幅に短縮する 「NTTイフのカシャ!比較見積もり」(愛称:カシャみつ)を開始 ~自動車保険証券の写真から最短90秒でお見積もりが可能なInsurTechサービス登場~ 株式会社エヌ・ティ・ティ・イフ(以下NTTイフ)は、2019年10月7日より自動車保険証券の写真や画像をもとにAIが入力補助をおこなう「NTTイフのカシャ!比較見積もり」(愛称:カシャみつ)を開始しました。 本サービスは、自動車保険証券などを撮影しWebサイトにアップロードするとAI-OCR技術(*1)とNTTイフの自動解析技術を使って記載内容を読み取り、自動車保険の見積もりに必要な項目を「NTTイフの一括比較見積もり」の見積入力画面に自動的に反映するサービスとなります。本サービスの利用により、5分程度かかっていた入力から見積もり結果表示までの時間が、最短90秒に短縮されます。 スマートフォンで撮影した

                                                                          保険見積もりの時間を大幅に短縮する 「NTTイフのカシャ!比較見積もり」(愛称:カシャみつ)を開始 | InsurTechJapan
                                                                        • Oh!FM-7 Blog | 「Program List OCR」の追加報告

                                                                          2018年5月21日ソフトウェア,雑誌・書籍 前回の記事でも取り上げた、eighttails氏が公開されたOCRソフト、「Program List OCR」でいくつかのプログラムリストを認識させてみました。 プログラムリストとプリンターの関係について プログラムの打ち込み経験のある方ならご存知かと思いますが、当時の出版物に掲載されたリストは、プリンターで出力したものをそのまま掲載するという形を採っていました。そしてよく見ると、雑誌によって、あるいは機種によって、リストの字体が異なっているのに気づかされます。 これは、FMシリーズ対応、PCシリーズ対応、MZシリーズ対応……といったように、各々のPCに対応したプリンターが存在したためです(ただし、複数の機種に対応したプリンターも少なくはありませんでした)。各プリンターが持っているフォントの字体がそれぞれ異なるため、様々な字体によるリストが

                                                                            Oh!FM-7 Blog | 「Program List OCR」の追加報告
                                                                          • 射影変換 - Wikipedia

                                                                            出典は列挙するだけでなく、脚注などを用いてどの記述の情報源であるかを明記してください。記事の信頼性向上にご協力をお願いいたします。(2018年12月) 射影幾何学において、n 次元射影空間の射影変換(しゃえいへんかん)とは、射影空間の同型写像である。図学的には中心投影変換に相当する[1]。 定義[編集] 体 k 上の n 次元射影空間 Pn(k) とは、ベクトル空間 kn+1 から原点を除いた空間を体 k の乗法群 k* のスカラー倍の作用で割った空間 のことである。すると、kn+1 の間の同型写像 f は、スカラー倍と可換であり、また 0 でないベクトルを 0 でないベクトルに写すから、Pn(k) の間の同型写像を誘導する。これが Pn(k) の射影変換である。 例[編集] リーマン球面 CP1 の一次分数変換 関連項目[編集] 射影変換群 脚注[編集]

                                                                            • オンラインの OCR:画像ファイルをすばやく検索 – Dropbox

                                                                              Dropbox アカウント内の画像やスキャンしたドキュメントを、ファイル中のテキストで検索して、目的のコンテンツをすばやく見つけましょう。 OCR とは、「Optical Character Recognition」(光学文字認識)または「Optical Character Reader」(光学式文字読み取り装置)の略称で、画像ファイルに含まれるテキストの「認識」や「読み取り」に用いられる技術です。 OCR は、キーボード入力、手書き、または印刷によるテキストの画像を、機械で処理、検索できるテキストに変換します。たとえば、スキャンしたドキュメント、ドキュメントを撮影した写真、文字情報が含まれる看板や景色の写真、映像の字幕などをテキストに変換できます。 現時点で、Dropbox は OCR を使用して PDF に含まれるテキストを認識し、簡単に検索できる文字情報に変換しています。このため、必

                                                                                オンラインの OCR:画像ファイルをすばやく検索 – Dropbox
                                                                              • OCR API 検索可能 PDF Google Drive API - Google 検索

                                                                                2023/03/07 · OCRはOptical Character Recognitionの略で、PDFや画像などのデジタルデータ内の文字を識別し、利用可能なテキストデータに変換する技術となります。

                                                                                • リコー、納品書の処理を電子化するサービス、クラウドOCRとBPOを組み合わせて提供 | IT Leaders

                                                                                  IT Leaders トップ > テクノロジー一覧 > アプリケーション > 新製品・サービス > リコー、納品書の処理を電子化するサービス、クラウドOCRとBPOを組み合わせて提供 アプリケーション アプリケーション記事一覧へ [新製品・サービス] リコー、納品書の処理を電子化するサービス、クラウドOCRとBPOを組み合わせて提供 2019年12月17日(火)IT Leaders編集部 リスト リコーは2019年12月16日、納品書の処理業務プロセスをデジタル化し、中小企業の生産性向上を支援する「RICOH Cloud OCR for 納品書+BPO サービス」を発売した。クラウド型のOCR(光学文字認識)サービスとBPO(ビジネスプロセスアウトソーシング)サービスを組み合わせて提供する。 RICOH Cloud OCR for 納品書+BPO サービスは、紙の納品書を文字データ化する、

                                                                                    リコー、納品書の処理を電子化するサービス、クラウドOCRとBPOを組み合わせて提供 | IT Leaders