並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 423件

新着順 人気順

OCRの検索結果281 - 320 件 / 423件

  • AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 | IT Leaders

    IT Leaders トップ > 経営課題一覧 > 業務改革 > 新製品・サービス > AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 業務改革 業務改革記事一覧へ [新製品・サービス] AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 2021年12月20日(月)日川 佳三(IT Leaders編集部) リスト AI insideは2021年12月20日、AI-OCRサービス「DX Suite」を強化したと発表した。読み取れる非定型帳票モデルを増やし、新たに保険加入時に発行する「保険証券」を読み取れるようにした。過去に販売した保険内容のデータベース化を支援する。こうしてデータベース化したデータは、新たなプランの提案などに役立つ。 DX Suiteは、クラウドサービス型のAI-OCR(光学文字認識)ソフト

      AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 | IT Leaders
    • QuickOCR

      Quick OCR is a tool that recognize text using OCR included in the range selected on the screen with the mouse. 画面上任意の範囲を選択してOCRすることができます。 選択した範囲が表になっている場合はExcelコピー可能な表形式に出力可能です。 (罫線が淡色の場合や背景色が濃い場合、余白が大きい場合は表として正しく認識されません) 日本語、英語の両方の言語設定でOCRします。 Windows10の標準のOCRエンジンを使用しています (このため、認識精度は無いよりマシというレベルです)。 範囲選択モードで起動することで初期画面をスキップすることができます。 範囲選択モードでの起動方法はこちら You can select any range on the screen and pe

      • Tesseract OCR 5.3.3 のインストールと動作確認(多言語の文字認識)(Windows 上)

        【要約】 Tesseract OCR 5.3.3はWindows上での多言語文字認識ソフトウェアである.公式ページからインストール手順を確認し,必要な言語データをダウンロードして適切なディレクトリにインストールする.Windowsでの日本語文書読み取りには,画像を用意しコマンドプロンプトで指定コマンドを入力し,文字認識を行う.高解像度画像を使うことで、認識の精度が向上する傾向にあるようだ.以上がTesseract OCR 5.3.3のインストールと使い方の手順である. 【関連する外部ページ】 公式ページ: https://github.com/tesseract-ocr/tessdoc 【サイト内の関連ページ】 Tesseract OCR の使い方: 別ページ »にまとめ Ubuntu での Tesseract OCR のインストール: 別ページ »で説明している. Tesseract O

        • 【2021年版】Azure/GCP/AWS OCRサービス比較 - Qiita

          はじめに 概要 AzureのOCR機能のレビュー記事を書いた際に、他のクラウドベンダーのOCRサービスとの比較についてお問合せ頂きました。 以下のレビュー記事です。 - AzureのOCR機能(Cognitive Service Read API v3.2)が日本語対応したので使ってみた 今回は、主要なパブリッククラウドであるAzure/GCP/AWSのOCRサービスについて比較してみましたので紹介したいと思います。 この記事の想定読者 クラウドが提供するOCR機能に興味のある方 どのクラウドサービスを導入しようか迷われている方 各社サービスの機能比較 Azure/GCP/AWSが提供するOCRサービスの比較を一覧表にまとめました。 ※2021/5/17時点で最新のバージョンを使用して検証しています。 対応言語数、価格ではAzureが一歩リードしているように思います。 対応ファイル数はGC

            【2021年版】Azure/GCP/AWS OCRサービス比較 - Qiita
          • TechCrunch

            Welcome, folks, to Week in Review (WiR), TechCrunch’s regular newsletter covering this week’s noteworthy happenings in tech. TikTok’s fate in the U.S. looks uncertain after President

              TechCrunch
            • 【2024年版】無料オープンソースのOCRソフトウェア10選を徹底比較!(PDFや画像からテキスト情報を抽出)

              ブログ通信・システム【2024年版】無料オープンソースのOCRソフトウェア10選を徹底比較!(PDFや画像からテキスト情報を抽出) こんにちは。マニュアル作成・ナレッジ共有ツール「NotePM」ブログ編集局です。 企業内ではテキストデータのみならず、さまざまなバイナリデータがやり取りされます。良くあるのはPDFの帳票です。そうしたデータの中から必要な数字、テキストを抽出する際に便利なのがOCRです。 OCRを使うことで、PDFや画像からテキストが抽出できます。システム自動化を考える際に役立つので、覚えておきましょう。 macOCR macOS向けのコマンドで、任意の範囲を指定してテキストデータを抽出します。抽出されたテキストは標準出力の他、クリップボードにもコピーされます。 範囲の選択時にはマウスを利用するので、見た目にもわかりやすいですし、画像の一部からテキストを抜き出すのにも利用できま

                【2024年版】無料オープンソースのOCRソフトウェア10選を徹底比較!(PDFや画像からテキスト情報を抽出)
              • Flutter + ML Kitを使ってオフラインで動く日本語OCRアプリを作る

                はじめに これまで画像から日本語のテキスト認識(OCR)の機能を実現する場合は、GoogleのCloud Vision APIなどを利用していました。 この方法の問題として、テキスト認識を行いたい画像を一度サーバー側へアップロードする必要があり、解析結果を取得するまでにある程度は時間がかかってしまうことでした。さらにCloud Vision APIの場合は料金が発生してしまいます。 しかし、Googleが公開しているML Kitの中の一つであるText Recognition v2(Beta)では日本語がサポートされ、デバイス上のみで日本語のテキスト認識処理を完結できるようになりました。 今回はML Kit Text Recognition v2を導入してFlutterアプリでテキスト認識機能を実現したいと思います。 環境 Flutter 3.3.5 プロジェクト作成 $ flutter

                  Flutter + ML Kitを使ってオフラインで動く日本語OCRアプリを作る
                • GitHub - amebalabs/TRex: Copy any text on your screen, stop retyping.

                  TRex captures any text right into your Clipboard with magic of OCR. But what is OCR anyway? Imagine you have a PDF file or a Web page where you can't select the text, image with text on it, or even a YouTube video. Forget retyping it manually; with TRex, you can extract text from anywhere, and it is as easy as taking a screenshot. TRex lives in the menu bar and available right where you need it th

                    GitHub - amebalabs/TRex: Copy any text on your screen, stop retyping.
                  • 【検証】iOS15新機能「テキストの認識表示」は日本語環境でどこまで使える? - iPhone Mania

                    iOS15の新機能「テキストの認識表示」は、iPhoneのカメラで捉えた画像に含まれる文字を自動認識し、コピー&ペーストや検索に利用できます。残念ながら日本語に非対応ですが、iOS15のパブリックベータ3でどこまで使えるか、試してみました。 日本語非対応の「テキストの認識表示」 iOS15では、写真の中のテキストをコピー&ペーストや検索、翻訳できる「テキストの認識表示」(英語ではLive Text)機能が、A12 Bionic以降を搭載したiPhoneで利用可能になります。 Appleの発表では、「テキストの認識表示」が利用できる言語は英語、中国語、フランス語、イタリア語、ドイツ語、スペイン語、ポルトガル語の7言語で、残念ながら日本語は対応言語に含まれていません。 使えればとても便利そうな機能だけに、日本語に非対応なのは残念です。一部だけでも活用することはできないかと考え、日本語版のiOS

                      【検証】iOS15新機能「テキストの認識表示」は日本語環境でどこまで使える? - iPhone Mania
                    • iOS 14メモアプリの「スキャン機能」で書類をデータ化しよう! - 週刊アスキー

                      iOS 14では、「メモ」アプリから書類をスキャンして保存することが可能です。使い方をチェックしましょう。 「メモ」を開くと、キーボードの上部にカメラのアイコンが確認できると思います。カメラのアイコンをタップし、ポップアップメニューから「書類をスキャン」をタップしましょう。 カメラが立ち上がるので、スキャンしたい書類にカメラを向けます。書類の範囲が自動的に選択され、薄い黄色で表示されます。スキャン時、書類を置く場所は、書類とはっきり色が異なる方が、うまくスキャンしやすいようです。 シャッターが自動的に切れるので、うまく撮れている場合は「スキャンを保持」を、撮影しなおしたい場合は「再撮影」をタップ。 「スキャンを保持」を選択すると、右下に「保存」というボタンが表示されるので、タップすると、スキャン済みの書類が保存されます。連続で複数前の書類をスキャンし、まとめて保存することも可能です。

                        iOS 14メモアプリの「スキャン機能」で書類をデータ化しよう! - 週刊アスキー
                      • 検索可能になっていないPDFを、ScanSnap付属アプリでOCR処理をして検索可能なPDFにする方法(ScanSnapでスキャンした1ページのPDFにJPGとして追加してからOCR処理する)

                        検索可能になっていないPDFを、ScanSnap付属アプリでOCR処理をして検索可能なPDFにする方法(ScanSnapでスキャンした1ページのPDFにJPGとして追加してからOCR処理する) 前提 Mac MacBook Pro macOS Big Sur ScanSnap 富士通 PFU ドキュメントスキャナー ScanSnap iX1600 (ホワイト/両面読取/ADF/4.3インチタッチパネル/Wi-Fi対応) - Amazon.co.jp 問題 検索可能になっていないPDF(ScanSnap以外で作成された画像のみのPDF)は、そのままではScanSnap付属アプリでOCR処理できない。 解法 ScanSnapでスキャンした1ページのPDFを用意しておき、そこにOCR処理したい全ページをJPGとして挿入したPDFを作ってから、それをOCR処理すればいい。 手順 ScanSnapで

                          検索可能になっていないPDFを、ScanSnap付属アプリでOCR処理をして検索可能なPDFにする方法(ScanSnapでスキャンした1ページのPDFにJPGとして追加してからOCR処理する)
                        • Google、統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表

                          Google、統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表:ドキュメントから洞察を引き出す Googleは複雑なドキュメントから構造化データを抽出する際に役立つ統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表した。RPA(Robotic Process Automation)と同様の処理が可能であり、幾つかの定型的な書式については処理手順があらかじめ定義されていて、結果をすぐに確認できる。 Googleは2020年11月5日(米国時間)、統合型ドキュメント処理コンソール「Document AI」(DocAI)プラットフォームを発表し、プレビュー版の提供を開始した。 DocAIプラットフォームは主に3つのドキュメント活用を支援する。 データの正確性とコンプライアンスを確保 全てのドキュメントを自動化、検証し、コンプライアンス

                            Google、統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表
                          • AIDB on X: "Googleは、LLMを活用して「非構造化文書(例えばレシートなど)」から高精度にテキストを抽出するOCR『LMDX』を発表しました。 BardとGoogle drive等との連携をさらに強化する可能性のある技術です。 ○ Fernanda De La Torre et al., "LMDX: Language Model-based Document Information Extraction… https://t.co/XhWPd88l9A"

                            • GitHub - tesseract-ocr/tessdata_best: Best (most accurate) trained LSTM models.

                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                GitHub - tesseract-ocr/tessdata_best: Best (most accurate) trained LSTM models.
                              • 電子帳簿保存法対応ソフトウェアカオスマップを初公開 ~AI-OCRでペーパーレス化推進~

                                企業の DX を推進する国内最大級の AI ポータルメディア「AIsmiley」を運営するアイスマイリーは、各業界のDX推進の支援の一環として電子帳簿保存法対応ソフトウェアをまとめた「電子帳簿保存法対応ソフトウェア カオスマップ」を公開します。掲載数は合計で56サービス。 電子帳簿保存法対応ソフトウェア カオスマップ2022 ※2022年07月4日作成、更新 こちらのカオスマップは電子帳簿保存法対応ソフトウェアを用途別で探せるように「スキャナ保存」「電子帳簿ソフト」「電子書類作成・取引」等のカテゴリーに分け、合計56サービスをマッピングしております。作成にあたり参考にしたサービスURL、電子帳簿保存法対応ソフトウェアベンダーを記載した一覧表(Excel)は、カオスマップ資料請求後に電子帳簿保存法対応ソフトウェアの導入を検討している企業ご担当者様に無償でご案内いたします。 電子帳簿保存法対応

                                  電子帳簿保存法対応ソフトウェアカオスマップを初公開 ~AI-OCRでペーパーレス化推進~
                                • OCR実装など機能拡張が続くWindows標準アプリ - 阿久津良和のWindows Weekly Report

                                  レポート OCR実装など機能拡張が続くWindows標準アプリ - 阿久津良和のWindows Weekly Report Windows 10時代は「切り取り領域とスケッチ」に置き換わる予定だったSnipping Toolだが、ここに来て機能強化を重ねている。たとえば2023年の年初には動画撮影に対応。筆者は業務で動画ファイルを使用する場面はほぼないため、検証以上には使い込んでいないが、便利に活用しているユーザーもいるだろう。 安定版Windows(ビルド22621.2283)のSnipping Tool Snipping Toolが続いて搭載する新機能は、OCRだ。公式ブログによると、ディスプレイに映し出されたアプリやスクリーンショットから任意の範囲を指定すると、その内容をテキスト化してクリップボードに取り込み、ほかのアプリで利用できるというもの(もちろんテキスト化が可能なものに限られ

                                    OCR実装など機能拡張が続くWindows標準アプリ - 阿久津良和のWindows Weekly Report
                                  • https://www.jstage.jst.go.jp/article/fss/30/0/30_154/_pdf/-char/ja

                                    • 古典籍資料のOCRテキスト化実験(令和4年度~) | NDLラボ

                                      令和4年度以降、令和3年度OCR処理プログラム研究開発 及び令和4年度NDLOCR追加開発事業で得た知見を生かし、古典籍資料を対象としたOCR処理プログラム(以下、「NDL古典籍OCR」といいます。)の内製開発と、古典籍資料のテキスト化実験を実施しています。 令和5年8月8日にNDL古典籍OCR ver.2を公開しました。読み順整序機能が向上したほか、文字認識性能が改善しています。 令和6年2月7日にNDL古典籍OCR ver.3を公開しました。漢籍資料のレイアウト認識性能が向上しています。 ※資料毎にばらつきがありますが、ver.2をver.1と文字認識性能で比較すると概ね約2%文字認識の正確性が改善しています。評価用に学習対象から除外した みんなで翻刻「翻刻!江戸の医療と養生」プロジェクト(外部サイト)の翻刻テキスト3,028画像分を正解としてver.2のテキスト化品質を評価すると、F

                                      • RPAとAI-OCR、失敗企業に共通してみられる傾向を専門家が分析

                                        RPAの「期待と現実」のギャップはなぜ生まれるのか RPAの「失敗事例」に共通してみられる2つの傾向 AI-OCRはなぜ精度が向上したのか AI-OCRの「できることできないこと」 RPAの「期待と現実」のギャップはなぜ生まれるのか 国内企業で約7割の企業がRPAを導入または前向きに検討している──。2019年1月にMM総研が実施した調査ではそんな結果が出た。有効回答数は1112社で、導入済みとの回答は32%、検討中は37%、未導入は31%という内訳だ。こうした数字見る限り、RPAは企業に広く浸透し、今後も導入が増えると予想できる。 RPA導入に全くリスクがないと考えるIT担当者はそう多くはないだろう。管理の目がいき届かないロボットが作成、利用される「野良ロボット」の問題や、連携するソフトウェアがバージョンアップした場合にロボットを継続的に修正するメンテナンスの工数、作成者の移動や退職に左

                                          RPAとAI-OCR、失敗企業に共通してみられる傾向を専門家が分析
                                        • PyOCR+Tesseract+画像処理でノベルゲームのテキストを抽出する - Qiita

                                          はじめに 私が趣味でノベルゲームをプレイするとき、たまに意味を知らない単語や難読単語、実物を画像で調べたくなる単語(作中で話題に上がった料理など)が登場することがあります。 このようなとき、通常は手動でブラウザを開いて検索ワードを入力するのですが、本記事では、ゆずソフト作のノベルゲーム『千恋*万花』(Steam全年齢版リンク)を例に、この作業をある程度自動化してみます。1 具体的には、Pythonで以下を順に試してみます。 OCR(光学文字認識)の導入 メッセージウィンドウの切り抜き・OCRによるテキスト抽出 画像処理によるOCRの認識性能向上 簡単なGUIアプリの作成 OCRの環境構築 OCR(Optical Character Recognition / 光学文字認識)とは、活字や手書きの文章を画像として読み込み、これを文字コードの列に変換する技術を指します。 様々なOS上でOCRを実

                                            PyOCR+Tesseract+画像処理でノベルゲームのテキストを抽出する - Qiita
                                          • クラウド自動仕訳作成ツール「KiCHO」にAI-OCRを搭載 2022年3月まで200社限定でAI-OCR機能を無償で利用可能

                                            TOP > プレスリリース一覧 > 「その他IT・インターネット (企業向け)」のプレスリリース > クラウド自動仕訳作成ツール「KiCHO」にAI-OCRを搭載 2022年3月まで200社限定でA... 財務会計・給与計算パッケージソフトメーカーの株式会社シスプラ(所在地:群馬県高崎市、代表取締役社長:椛澤 均)は、クラウド自動仕訳作成ツール「KiCHO(β2)」にAI-OCR(自動仕訳作成機能)を搭載しました。 AI-OCRの解析エンジンには世界最高水準の認識精度を誇るLINE CLOVA OCR(LINE株式会社)を採用。 ■仕訳作成に特化したクラウドツール「KiCHO」 「あらゆる取引から仕訳を作成し入力業務ゼロを目指す」をコンセプトに開発されたKiCHOは、今回AI-OCR(画像認識)による自動仕訳作成機能を搭載しました。スキャナーやスマホで撮影したレシートや領収書の画像データを

                                              クラウド自動仕訳作成ツール「KiCHO」にAI-OCRを搭載 2022年3月まで200社限定でAI-OCR機能を無償で利用可能
                                            • Vision API OCR事始め(2):検出されたテキストの階層構造(fullTextAnnotation)

                                              大福好きの甘党ソフトウェアエンジニア(主に業務システム系)である『テクノ大福』のブログです。面白そうな技術、影響を受けた本や音楽などを共有したいと思っています。

                                                Vision API OCR事始め(2):検出されたテキストの階層構造(fullTextAnnotation)
                                              • 「ト」と「卜」の違い、分かる?

                                                正しい見出しは上? それとも下? そもそも違いが分かりますか? 違うのはカタカナの「ト」か漢字の「卜」か。単独で見ると、見抜くのはほとんど不可能ではないでしょうか。この日の担当者はPDFに検索をかけて“間違い”を指摘しました。 上の画像では、間違っていると指摘したのは下。それを上のように直したのです。 重ねて切り替えてみると違うのが分かりますが、差はほんのわずかです。 酷似したカタカナと漢字では、他に「二」と「ニ」、「タ」と「夕」などもありますが、「ト」と「卜」はそれらを上回る見分けにくさのような気がします。 日本テレビのアナウンサー、水卜麻美(みうら・あさみ)さんの「卜」はカタカナの「ト」ではありません。これに対しTBSのアナウンサー、新タ(にった)悦男さんは漢字の「夕」ではなくカ… http://t.co/vR67NPPBdh pic.twitter.com/9Vvm05JaOh —

                                                  「ト」と「卜」の違い、分かる?
                                                • ScanSnapで一万冊の本をスキャンして管理して読むおはなし - Qiita

                                                  はじめに この記事は、私がいままでに約1万冊の薄い本や薄くない本をスキャンしてきたお話のまとめです。 この記事にはコードは殆ど含まれていませんが、ノウハウは含まれていますので、参考になるかと思います。 スキャンしてできたpdfはそのままでは役に立たないので、変換や整理をして便利にしましょう、ということですね。 手段と目的 書籍スキャン、つまり自炊をするにあたって最初に注意しなければならないのは、「自炊は目的か手段か」をはっきりさせることではないでしょうか。 世の中には自炊紹介をするサイトや同人誌がたくさんありますが、私が自ら自炊するにあたっては「自炊は手段」「目的は読書」として行なっています。 趣味というのは仕事と異なり、目的と手段の交換が許される世界です。たとえば鉄道というのもは一般に移動手段であり道具にすぎないのですが、鉄道趣味の人は鉄道そのものが目的となります。 「自炊が趣味」でした

                                                    ScanSnapで一万冊の本をスキャンして管理して読むおはなし - Qiita
                                                  • Screen Translator:DeepLを翻訳エンジンとして使えるOCRソフト | お手軽ふりーなもの探検記

                                                    翻訳も可能な Windows 用フリーの OCR ソフト『Screen Translator』の紹介です。 Screen Translator は、英和・和英だけでなくて多言語の翻訳が可能な OCR ソフトです。 スクリーンに表示されている文字列の抽出&コピーをし、必要に応じて自動翻訳も可能。 文字列の抽出もマウスドラッグで囲んだ領域内にあるテキストを自動抽出してくれます。 しかも、単一エリアだけではなくて、複数のエリアを範囲指定しての抽出&翻訳も可能。 また、基本的にはデフォルトで設定している言語に自動翻訳されますが、 必要に応じて、言語の組み合わせを替えることも可能。 ホットキーでの操作や Hunspell によるスペルチェック機能も搭載。 OCR エンジンには、Google の Tesseract を使用します。 翻訳エンジンには、以下の翻訳エンジンを使用可能。 GoogleGoog

                                                      Screen Translator:DeepLを翻訳エンジンとして使えるOCRソフト | お手軽ふりーなもの探検記
                                                    • TIS、AI-OCR活用の前処理を自動化する「帳票振り分けAIサービス」を提供

                                                      印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます TISは、複数の帳票フォーマットを人工知能(AI)で自動振り分けする「帳票振り分けAIサービス」を提供した。 このサービスは、これまで帳票を識別する際に必要だった認識コードの付与などをすることなく、独自のアルゴリズムにより高精度に帳票の振り分けができる。 振り分けのために煩雑な設定は必要なく、サンプル帳票を1枚アップロードするだけで振り分けの設定が完了する。フォーマットを判定するため、フォーマットの特徴(表・タイトルなど)を画像処理技術で自動的に抽出し、マッチングを行う独自アルゴリズムを採用している。FAX画像のようにノイズや歪みがある場合でも、適切に特徴抽出・マッチングが行えるという。 AI-OCR(AIを付加した光学的文字認識技術)

                                                        TIS、AI-OCR活用の前処理を自動化する「帳票振り分けAIサービス」を提供
                                                      • AI OCR | メディアドライブ

                                                        AI OCRを利用することで、手書き文字の認識精度が向上します。癖字、達筆、個性的な文字も高精度に認識することが可能となります。 AI OCRを利用することで、従来、精度向上が難しいとされた「文字や行の接触」「かすれ文字」などの認識精度が劇的に改善し、地紋領域に書かれた文字(文字の背景に地紋や情景画像があるケース)、罫線にかかる文字、取り消し線なども高精度に認識できるように進化しました。 また、AI OCRが得意とするドキュメント画像理解により、今までOCRで実現困難とされていた書類(文書/帳票)も高精度でOCRできます。従来のOCRでは、あらかじめレイアウトが決まっている「定型帳票」の運用がほとんどでしたが、AI OCRでは、注文書や領収書のような企業/店舗や種類ごとにレイアウトが異なる「準定型帳票」にも対応可能となり、加えて、契約書や図面などのフリーフォーマットで作成された文書への対応

                                                        • 手書き文書をクラウド経由でデジタル化できるサブスク型サービス「おまかせAI OCR」

                                                          AI insideと西日本電信電話(以下、NTT西日本)は、サブスクリプション型OCRサービス「おまかせAI OCR」を12月2日から提供する。初期費用不要のサブスクリプション型サービスで、月額3万3000円から(最低利用期間は1年間、税込み)。また協賛パートナー企業へのOEM提供も予定している(要問合せ)。 手書き文字認識AIを搭載したOCRサービス「DX Suite」と、NTT西日本の通信インフラを組み合わせたクラウドサービス。受発注帳票やアンケート結果などの手書き文章をPDF形式でクラウドにアップロードすることで、電子データ化(CSV形式)を行える。ディープラーニングを活用した高い識字率を実現しているのが特徴で、ゆがみや傾きのある文書の読み取りにも対応した。また、オプション機能として帳簿種別ごとの出力自動仕分け機能も用意している。

                                                            手書き文書をクラウド経由でデジタル化できるサブスク型サービス「おまかせAI OCR」
                                                          • GitHub - robertknight/ocrs: Rust library and CLI tool for OCR (extracting text from images)

                                                            ocrs is a Rust library and CLI tool for extracting text from images, also known as OCR (Optical Character Recognition). The goal is to create a modern OCR engine that: Works well on a wide variety of images (scanned documents, photos containing text, screenshots etc.) with zero or much less preprocessing effort compared to earlier engines like Tesseract. This is achieved by using machine learning

                                                              GitHub - robertknight/ocrs: Rust library and CLI tool for OCR (extracting text from images)
                                                            • Vision API OCR事始め(1):TEXT_DETECTIONとDOCUMENT_TEXT_DETECTIONの違い

                                                              大福好きの甘党ソフトウェアエンジニア(主に業務システム系)である『テクノ大福』のブログです。面白そうな技術、影響を受けた本や音楽などを共有したいと思っています。

                                                                Vision API OCR事始め(1):TEXT_DETECTIONとDOCUMENT_TEXT_DETECTIONの違い
                                                              • [Python] PDFをOCR処理して、テキスト埋め込みPDFを作成する - Qiita

                                                                import os import sys import time import threading import subprocess from pdf2image import convert_from_path import tkinter as tk from tkinter import ttk from tkinter import messagebox from tkinter import filedialog from tkinter import scrolledtext class Application(tk.Frame): def __init__(self, master=None): super().__init__(master) self.master.geometry('500x330') self.master.title('PDF OCR') self

                                                                  [Python] PDFをOCR処理して、テキスト埋め込みPDFを作成する - Qiita
                                                                • Google提供視覚障害者向けアプリ「Lookout」画像要約機能実装

                                                                  視覚障害者向け Android アプリ「Lookout」にアプリバージョン v4.0(v4.0_reveal_20230811.00_RC03 (arm64-v8a))アップデートが配信 2023 年 5 月にクローズドベータ機能として提供された画像要約機能「画像モード」を実装 そのほかの機能も最適化 2023 年 8 月 18 日(金)、視覚障がい者向け被写体認識 Android アプリ「Lookout(Lookout by Google)」に対し、プリバージョン v4.0(v4.0_reveal_20230811.00_RC03 (arm64-v8a))アップデートが配信開始されました。 今回の「Lookout」アプリ v4.0 では、2023 年 5 月にクローズドベータ機能として提供された画像要約機能「画像モード」が、ベータ版として実装されています。「Lookout」アプリの「画像

                                                                    Google提供視覚障害者向けアプリ「Lookout」画像要約機能実装
                                                                  • LINE BRAIN技術を利用したチャットボットとOCR、SaaSでの提供を開始

                                                                    「LINE BRAIN」は、LINEが2019年7月に開始した、同社のAI技術を外部企業などに提供するAIソリューション事業で、チャットボット技術、文字認識技術、音声認識技術などを提供しており、近年ではAI電話応対サービス「LINE AiCall」の実証実験を実店舗で開始したり、「LINE DEVELOPER DAY 2019」にて顔認証受付を実施したりといった活動を行っている。 「LINE BRAIN CHATBOT」と「LINE BRAIN OCR」は、NAVER Business Platformから「NAVER CLOUD PLATFORM」として提供される。 「LINE BRAIN CHATBOT」は、最新の機械学習アルゴリズムと自然言語処理技術に基づく強力な対話エンジンによって、業界最高水準の正答率を誇るAIチャットボット。エンジンは日本語だけでなく、英語、韓国語に対応しており

                                                                      LINE BRAIN技術を利用したチャットボットとOCR、SaaSでの提供を開始
                                                                    • 次期macOSの新機能「テキストの認識表示」がIntel Macでも利用可能に - iPhone Mania

                                                                      AppleがリリースしたmacOS Montereyベータ4で、以前はM1 Macのみと発表されていた新機能「テキストの認識表示」が、Intelプロセッサ搭載Macでも利用可能になったことが分かりました。 M1 Macのみ対応だった新機能 Appleは6月の世界開発者会議(WWDC21)でmacOS MontereyやiOS15で利用できる新機能として、写真に含まれる文字をコピー&ペーストや翻訳できる「テキストの認識表示」を発表しました。 しかし、Appleが公開したmacOS Montereyのプレビューページには、「テキストの認識表示」について「M1チップを搭載したMacコンピュータで利用できます」と注釈があり、Intelプロセッサ搭載のMacでは利用できないと案内されています。 なお、macOS Montereyの新機能のうち、Face Timeで背景をぼかす、アイテムの3Dスキャン

                                                                        次期macOSの新機能「テキストの認識表示」がIntel Macでも利用可能に - iPhone Mania
                                                                      • unilm/trocr at master · microsoft/unilm

                                                                        TrOCR is an end-to-end text recognition approach with pre-trained image Transformer and text Transformer models, which leverages the Transformer architecture for both image understanding and wordpiece-level text generation. TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models, Minghao Li, Tengchao Lv, Lei Cui, Yijuan Lu, Dinei Florencio, Cha Zhang, Zhoujun Li, Furu Wei, A

                                                                          unilm/trocr at master · microsoft/unilm
                                                                        • PC-8001を懐かしむページ

                                                                          最近はOCRの性能が上がって、ダンプリスト入力(マシン語ゲームの入力)が非常に楽になりました。ただ、やっぱり間違いはあるので、 チェックサムを計算して修正作業は人間の手で必要です。 エミュ上でチェックサムを計算して、仮想プリンタに印刷してと、行ったり来たりの部分を効率化したいと考えてツールを作ってみました。 このツールを使うと、Windows上だけで、サムチェック、修正、cmt/t88/d88/p6t/mzt/cas/l3/pbf/wavファイル作成までができるようになります。 →DumpListEditorのダウンロードはこちらから(PC-6001、MZ-80K、MSXにも対応しました) 最初、Googleドライブ(詳しくは、ここなど)のOCR機能を使うことを考えていたのですが、普通の文の認識率はすごいのですが、ダンプリストの認識となるとなかなか厳しいようです。(文字種を16進で使う文字

                                                                          • ブルーアーカイブをアーカイブする|古村藍

                                                                            信じがたい事実です。ブルーアーカイブのストーリーをテキストとしてまとめたサイトがございません。これが何を意味するかといえば、ブルーアーカイブのストーリーや設定を確認するためにわざわざゲームを起動してあのテンポが悪い幕間劇を眺めて該当箇所を虱潰しに探さなければならないということでございます。 いちおうアーカイブを試みた者は何人かいたようですが、どれもこれも道半ばで力尽きております。そこで私がまとめようと思います。 やることはシンプルです。順序立てて考えてその後細分化していきましょう。 必要なものまず「何があればブルーアーカイブのストーリーをテキストとしてまとめられるのか?」を洗い出します。今回はOCR(光学式文字認識)を使った文字起こしを利用したいので、 ブルーアーカイブのストーリーモードのすべてのダイアログのスクリーンショット があればひとまずよろしいことになります。OCRの方は後からどう

                                                                              ブルーアーカイブをアーカイブする|古村藍
                                                                            • iOS 16では「テキスト認識表示」機能が日本語と韓国語、ウクライナ語をサポートし、カメラで撮影中の写真やSafari内の画像から日本語をコピー/翻訳することが可能に。

                                                                              iOS 16では日本語と韓国語、ウクライナ語でも「テキスト認識表示」機能が利用可能になっています。詳細は以下から。 Appleは2021年にリリースした「iOS 15/iPadOS 15」および「macOS 12 Monterey」に、写真内にあるテキストを抽出し、コピー&ペースト(OCR)できるようにする「テキスト認識表示 (Live Text)」を実装すると発表し、第1段として英語と中国語、フランス、イタリア、ドイツ、スペイン、ポルトガル語の計7言語がサポートされていましたが、 現地時間2022年09月15日にリリースされた、「iOS 16」では、これらの7ヶ国語に加え、日本語と韓国語、そしてウクライナ語でテキスト認識表示機能が利用できるようになっています。 A12 Bionic以降を搭載したiPhoneで利用できます。英語、中国語、フランス語、イタリア語、ドイツ語、日本語、韓国語、ポ

                                                                                iOS 16では「テキスト認識表示」機能が日本語と韓国語、ウクライナ語をサポートし、カメラで撮影中の写真やSafari内の画像から日本語をコピー/翻訳することが可能に。
                                                                              • Microsoft、WindowsのペイントやフォトにもAI機能を搭載する計画か

                                                                                Microsoftは現在、同社が提供するさまざまな製品に対してAI機能を導入することに力を注いでいる。まもなく正式リリースとされているWindows CopilotやMicrosoft 365 Copilotはその代表例である。Windows Centralは8月22日、「Microsoft might bring AI to apps like Paint and Photos」において、MicrosoftがペイントやフォトといったWindowsのデフォルトアプリに対してもAI機能の導入を実験していると伝えた。 著者のZac Bowden氏は、独自の情報筋から入手した話として、MicrosoftがフォトやSnipping Tool、ペイントなど、いくつかのWindows 11のデフォルトアプリにAI機能を追加することに取り組んでいることが判明したと説明している。フォトアプリでは写真内の物

                                                                                  Microsoft、WindowsのペイントやフォトにもAI機能を搭載する計画か
                                                                                • tesseractを試しに使って手書き文字(日本語)の認識精度を確認してみた。 - Qiita

                                                                                  はじめに オライリーのスクレイピングの本を読んでいた時、Tesseract について少し説明があった。 入手可能なオープンソースOCRの中で "最良で最も正確" と書かれていたため、どのくらいの精度が出るものなのか試しに確認してみたので、その時の内容をメモとして残す。 前提条件 【PC環境】 Windows 10 Pro 【SW or Packageのバージョン】 tesseract 5.2.0 Python 3.9.13 pyocr 0.8.3 OpenCV 4.6.0.66 メモ内容 1.Tesseract・pyocr のセットアップ。 2.いくつかの画像パターンで認識精度を確認してみる。 1.Tesseract・pyocr のセットアップ Tesseract のセットアップ 以下のサイトより、Tesseract のインストーラーをダウンロードする。 ※インストールの際にコンポーネント

                                                                                    tesseractを試しに使って手書き文字(日本語)の認識精度を確認してみた。 - Qiita