並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 414件

新着順 人気順

OCRの検索結果241 - 280 件 / 414件

  • 【TIPS】海外フリゲを自動翻訳しながら遊ぶ手順(Screen Translator, PCOT)|ソルト

    英語は苦手だけど気になるゲームがあるという悩みに応えてくれる素敵なソフトについて使用手順などをメモします。次の2つのソフトを触りました。どちらも無料で使用できます。制作者様に感謝。ヘビーユーズするようなら寄付などしたいです。 ①Screen Translator たぶん定番なソフトだと思います。海外の方が開発しているので、「英語が全くわからん」という場合は使いにくいですが、「アイキャンノットスピークイングリッシュ(ちょっとだけ分かる)」という場合の補助としては十分な機能だと感じました。 ②PCOT 2020年ごろに個人で開発されたソフトみたいです。一時期は配布が制限されていましたが、2021年7月現在は配布が再開しています。各所で話題になっている通り、使いやすいです。また、設定画面などが全て日本語なのもありがたいです。おススメ。 ◆はじめに◇そもそも何のために使うものなの? 「遊びたいゲー

      【TIPS】海外フリゲを自動翻訳しながら遊ぶ手順(Screen Translator, PCOT)|ソルト
    • PDF編集ソフト「EaseUS PDF Editor」が販売開始 ~日本語OCR機能も搭載/ファイル形式の変換機能が充実。機能を制限した体験版も用意

        PDF編集ソフト「EaseUS PDF Editor」が販売開始 ~日本語OCR機能も搭載/ファイル形式の変換機能が充実。機能を制限した体験版も用意
      • GitHub - OneMoreGres/ScreenTranslator: Screen capture, OCR and translation tool.

        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

          GitHub - OneMoreGres/ScreenTranslator: Screen capture, OCR and translation tool.
        • 【活用提案】「MS Office」のウェブ版とアプリ版の違いは? サブスクは必要? 自分に合った方法を見つけよう (1/3)

          【活用提案】「MS Office」のウェブ版とアプリ版の違いは? サブスクは必要? 自分に合った方法を見つけよう オフィス系アプリといったら真っ先に思い浮かべるのが「Microsoft Office」(以下、「MS Office」)だろう。パソコン向けのアプリとして圧倒的なシェアを誇り、ビジネスシーンではまさに定番。「Excel」や「Word」がなければ仕事にならないといった人も少なくないはずだ。 「MS Office」をiPadで使うにはいくつかの方法がある。しかし、その方法によって使える機能も異なるので、何がどのように使えるのかは知っておきたいところ。また、「MS Office」の機能をiPadでフル活用したいなら、「Microsoft 365」のサブスクリプション契約は必須だが、「Microsoft 365」には多様なライセンスが用意されていて、どれを選んだらいいかがわかりにくい。

            【活用提案】「MS Office」のウェブ版とアプリ版の違いは? サブスクは必要? 自分に合った方法を見つけよう (1/3)
          • GitHub - amebalabs/TRex: Copy any text on your screen, stop retyping.

            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

              GitHub - amebalabs/TRex: Copy any text on your screen, stop retyping.
            • OCRツールをまとめた「AI-OCRカオスマップ」が公開

              株式会社アイスマイリーはアナログの書類や帳票をデジタルに変換するOCRツールをまとめた「AI-OCRカオスマップ」を2021年4月19日に公開した。掲載数は合計104サービス。 OCRの製品・サービスにはツールによって機能や実現できる内容に違いがあるので、自社の課題は何か、どんな結果を実現したいのかという観点から、それぞれのツールの違いを充分に比較検討することが重要だ。OCRは、書類はもちろん、請求書などの帳票、名刺やナンバープレート、彫刻文字もいろいろなものをデジタル変換できる。RPAを駆使して、自社の基幹システムに処理したデータを出力するなど、活用シーンによって選択するOCRツールも異なる。 今回のカオスマップは、「AI-OCRを試したい」という人から「最新のOCRツールを探している」という人に向け、AIsmileyが独自の主観で、104の製品サービスを取りまとめ、マッピングしたものだ

                OCRツールをまとめた「AI-OCRカオスマップ」が公開
              • Tesseract+PyOCRで簡易OCRを試してみる - Qiita

                今回は「Tesseract OCR」と「PyOCR」を使用して、OCR(光学的文字認識)を試してみました。 Tesseract OCRとは 「Tesseract OCR」はGoogle、HPが開発したオープンソースOCRエンジン。 Unicode(UTF-8)をサポートしており、100以上の言語を「そのまま」認識できます。 PyOCRとは 「PyOCR」はPython用のOCRツールラッパー。 PythonプログラムからさまざまなOCRツールを使用できます。 現在サポートされているOCRツールは以下の3種類。 Libtesseract Tesseract Cuneiform 環境構築 ※実行環境はMacOSです。 1. Tesseract OCR ①Tesseractのインストール Homebrewの場合brew install tesseractで終了です。 ②学習データの準備 http

                  Tesseract+PyOCRで簡易OCRを試してみる - Qiita
                • 文書要約|AI文章要約|文章|要約|論文|AI

                  このサイトでは文書要約機能を提供しております。

                  • PDFを簡単に文字起こしする方法を徹底解説!便利な文字起こしツール10選もあわせて紹介

                    現在はデジタル化が進み、紙の文書ではなくPDFファイルの形式が主流となっていますが、PDFや画像内の文字をテキストとして取り出したいケースもあります。 しかし、PDFをすべて手入力で文字起こしするのは面倒ですよね。そんな時に便利な、PDFや画像の文字をテキスト化してくれるツールがあるのをご存知ですか? この記事では、PDFや画像内の文字を自動でテキスト化できる、便利な文字起こしツールについてまとめました。 PDFや画像を文字起こしするメリットPDFや画像のテキストを文字起こしすることで得られるメリットはたくさんあります。 具体的にどのようなメリットがあるか、詳しく見てみましょう。 手入力する手間が省ける PDFや画像内の文章を手入力で文字起こしする労力と時間が省けるので、効率化と生産性の向上を図れます。 データとして保管しておける 紙の資料のままだと破けたり紛失したりしてしまうこともありま

                      PDFを簡単に文字起こしする方法を徹底解説!便利な文字起こしツール10選もあわせて紹介
                    • vFlat Scan - PDFスキャナーとOCR - Google Play のアプリ

                      vFlatは無料の広告なしスキャナーです。 毎月最大10ページのテキスト認識(OCR)を無料で取得できます。 vFlatは、スキャンするページの境界を自動的に検出して修正します。 vFlatは、ドキュメント、書籍、メモなどの携帯電話で撮影した画像を高品質のPDFまたはJPG画像にするスキャンアプリです。 vFlatは自動的にドキュメントの境界を認識し、トリミングして修正します。キャプチャした画像をテキストに変換して、必要なキーワードを検索またはコピーすることもできます。 ●vFlatの主な機能 1。自動トリミングと認識機能 スキャンするドキュメントまたはブックページの境界を自動的に認識してトリミングします。いつでもどこでも簡単に使用でき、どの角度からでもきれいなスキャン結果が得られます。 2。フリーテキスト認識(OCR) テキスト認識により、スキャンした画像をテキストに変換できます。変換さ

                        vFlat Scan - PDFスキャナーとOCR - Google Play のアプリ
                      • NormCap - k本的に無料ソフト・フリーソフト

                        画面内に写っている文字列を、プレーンテキストとしてコピー可能にするシンプルな OCR ツール。 マウスドラッグで囲んだ領域内に写っている文字列を、プレーンテキストとしてクリップボードにコピーできるようにしてくれます。 「NormCap」は、クロスプラットフォーム(Windows / Linux / MacOS)に対応した OCR ツールです。 オープンソースの OCR エンジン “ Tesseract ” を利用したシンプルな OCR ツールで、画面内に写っている文字列を簡単な操作でクリップボード内にコピーできるようにしてくれます。 ソフトを実行すると即キャプチャが開始され、そのまま読み取りたい文字列をマウスドラッグして囲むだけで使えるようになっています※1。 1 ただし、デフォルトでは日本語の読み取りに対応していないので、日本語テキストを読み取りたい場合は少々設定が必要となる。 画像内に

                          NormCap - k本的に無料ソフト・フリーソフト
                        • OCR support for 73 languages in the Cognitive Services Computer Vision public preview | Azure updates | Microsoft Azure

                          Explore Azure Get to know Azure Discover secure, future-ready cloud solutions—on-premises, hybrid, multicloud, or at the edge Global infrastructure Learn about sustainable, trusted cloud infrastructure with more regions than any other provider Cloud economics Build your business case for the cloud with key financial and technical guidance from Azure Customer enablement Plan a clear path forward fo

                            OCR support for 73 languages in the Cognitive Services Computer Vision public preview | Azure updates | Microsoft Azure
                          • 【C#】Windows10のOCRを使用する - かくすけのいろいろ作るブログ

                            Visual Studio 2019 C# こんにちは。かくすけです。 前回、アプリの進捗を報告しました。 kakusuke98.hatenablog.com 画像をキャプチャし、文字認識、翻訳をするところまで作ったわけですが・・・ お金が気になる~~~ なんてったって、今の状態だと ・文字認識API呼び出し用のGateway(Amazon API Gateway) ・文字認識API呼び出し(AWS Lambda) ・文字認識(Google Cloud Vision API) ・翻訳API呼び出し用のGateway(Amazon API Gateway) ・翻訳API呼び出し(AWS Lambda) ・翻訳(Google Cloud Translation API) という6工程において課金が発生するのです。 うーん。ただでさえ最近収入が減ったのにこれは苦しい。 翻訳は仕方ないとして、せめ

                              【C#】Windows10のOCRを使用する - かくすけのいろいろ作るブログ
                            • Vision API OCR事始め(2):検出されたテキストの階層構造(fullTextAnnotation)

                              大福好きの甘党ソフトウェアエンジニア(主に業務システム系)である『テクノ大福』のブログです。面白そうな技術、影響を受けた本や音楽などを共有したいと思っています。

                                Vision API OCR事始め(2):検出されたテキストの階層構造(fullTextAnnotation)
                              • シナモンAI、第三者割当増資により第一生命から5億円資金調達を実施

                                このAIニュースのポイント シナモンAIが第一生命保険株式会社を引受先とする5億円の第三者割当増資を実施 保険金・給付金請求時に提出される診断書の手書き文字をテキスト化するAIを第一生命に提供 資金調達を通して第一生命社員のAI人材育成を支援し、保険業界全体のDX化に貢献 株式会社シナモンは、第一生命保険株式会社を引受先とする5億円の第三者割当増資を実施しました。 シナモンAIは、自然言語処理やAI-OCR、音声認識などのAI技術を組み合わせた様々な製品を展開する企業です。保険金・給付金請求時に提出される診断書の「医学用語が記載された手書き文字」をテキスト文字化するAI「Flax Scanner」を第一生命に提供しています。 非構造化データの活用は、第一生命のコンサルティングセールス面や契約管理のオペレーション面、あるいはコンプライアンス等の品質面において展開可能であり、シナモンAIはバリ

                                  シナモンAI、第三者割当増資により第一生命から5億円資金調達を実施
                                • AsadMemon

                                  Screenshot HeroScreenshot Hero scans through your screenshots (and other saved photos) and makes then instantly searchable by text in them. HighlightsImages are all processed on-device and nothing is sent to any server.Tested to work with thousands of images.Best and most performant OCR technology.Technical DetailsI wanted to build a simple utility app that would run OCR through my photos (all 500

                                    AsadMemon
                                  • GitHub - getomni-ai/zerox: Zero shot pdf OCR with gpt-4o-mini

                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                      GitHub - getomni-ai/zerox: Zero shot pdf OCR with gpt-4o-mini
                                    • PaddleOCR - a Hugging Face Space by akhaliq

                                      Discover amazing ML apps made by the community

                                        PaddleOCR - a Hugging Face Space by akhaliq
                                      • MacでTesseract OCRを使って画像内のテキストを取り出してみる

                                        こんにちは、アルバイトの上野です。今回はOCRを使って画像中のテキストを文字として取り出すtesseractというオープンソースについて紹介します。 インストール まずはbrewでインストールします $ brew install tesseract 次のコマンドで対応している言語を確認できます $ tesseract --list-langs List of available languages (3): eng osd snum 日本語が入ってないので日本語の学習済みモデルを入れる必要があります。 公式ドキュメントによるとGithub https://github.com/tesseract-ocr/tessdata_best から jpn.traineddataとjpn_vert.traineddataをダウンロードする必要があるそうです。 ただし、実はこの学習済みモデルよりUbun

                                          MacでTesseract OCRを使って画像内のテキストを取り出してみる
                                        • Biblog | Quote-hunting App

                                          Biblog is a quote collection app designed for you to save the words that move your heart. Its usage is very simple. Just capture the words that catch your attention and select them. We will then save beautifully and make them easily searchable.

                                            Biblog | Quote-hunting App
                                          • iOS14ではApple Pencilの手書き文字がテキスト認識可能に? - iPhone Mania

                                            iOS14では、Apple Pencilを使って手書きした文字が自動でテキスト認識されるようになる、と米メディアMacRumorsが報じています。 Apple Pencilで書いた文字を自動テキスト認識 MacRumorsが入手した情報によると、iOS14では、Apple Pencilで手書きした文字が自動でテキストとして認識されるようになるPencilKitの新機能が追加される模様です。 この機能を使うと、メッセージ、メモ、リマインダ、カレンダー、メールなど各種アプリで表示される入力フィールドに文字を手書きすると、キーボードで入力したようなテキストに変換されます。 PencilKitの新機能は、サードパーティ製アプリにも公開される可能性もありますが、iOS14で実現するかは不明です。 Appleが提供していない手書き文字のテキスト認識 Appleは、手書き文字を自動でテキスト変換する機能

                                              iOS14ではApple Pencilの手書き文字がテキスト認識可能に? - iPhone Mania
                                            • Flutter+ML Kitで賞味期限とバーコードを高速&高精度OCR

                                              はじめに今回開発したのは、スマホのカメラで素早く、食料品のバーコードと賞味期限を正確に読み取ることが可能なアプリです。 このアプリによって、当社の健康専門店のような物流倉庫での、アナログな食品管理が簡易できるようになります。 アプリ概要とUXどんなアプリかをざっくり見てもらうため、メインとなるスマホ画面を4枚ほどスクショしてきました。 このアプリでは、商品バーコードと賞味期限の読み取り、編集が可能です。 (商品バーコードスキャン)⇒賞味期限のOCR⇒データ編集&送信で1つのフローとなります。 多量の商品を管理する場面を考慮し、最短2タップで1つの商品情報を送信可能なUXとしました。 また、薄暗い倉庫での使用を想定しているため、カメラ使用時にはデフォルトでフラッシュライトがOnになっています。 製作工程次のセクションでは、アプリを開発するに至った経緯と実装方法を記しておきます。 1. 現状の

                                                Flutter+ML Kitで賞味期限とバーコードを高速&高精度OCR
                                              • LegalForce、シリーズDラウンドにおいて総額約137億円を資金調達

                                                LegalForceは、シリーズDラウンドにおいて総額約137億円の資金調達を実施しました。これによりエクイティによる累計資金調達額は約179億円になりました。 このAIニュースのポイント LegalForceがシリーズDラウンドにおいて総額約137億円の資金調達を実施 AIが契約書を解析し自動で台帳を作成する「LegalForceキャビネ」を展開 今回の資金調達で新たにSoftBank Vision Fund2、Sequoia China、Goldman Sachsが参画 株式会社LegalForceは、シリーズDラウンドにおいて総額約137億円の資金調達を実施します。これによりエクイティによる累計資金調達額は約179億円になります。 LegalForceは弁護士の法務知見と自然言語処理技術や機械学習などのテクノロジーを組み合わせ、企業法務の質の向上、効率化を実現するソフトウェアの開発・

                                                  LegalForce、シリーズDラウンドにおいて総額約137億円を資金調達
                                                • https://jp.techcrunch.com/2021/09/30/021-09-29-google-introduces-a-new-way-to-search-that-combines-images-and-text-into-one-query/

                                                    https://jp.techcrunch.com/2021/09/30/021-09-29-google-introduces-a-new-way-to-search-that-combines-images-and-text-into-one-query/
                                                  • AzureのOCRサービス「Azure Form Recognizer」入門 - Ohina Work

                                                    AzureのOCRサービス「Azure Form Recognizer」入門 注意 サービス名称に伴い最新版の記事はこちらに記載しました。 https://ohina.work/post/azure_ocr_di/#google_vignette はじめに Azureには、Azure Cognitive ServicesとAI機能をWeb APIして提供するサービスがあります。 本記事では、Azure Cognitive Servicesのうち、OCRサービス「Azure Form Recognizer」の使い方について紹介します。 Azure Cognitive Servicesとは Azure Cognitive Servicesは、視覚、音声、言語、決定、検索の5ジャンルからなるAI機能をWeb APIとして利用できるAzureのサービスです。 https://azure.micro

                                                      AzureのOCRサービス「Azure Form Recognizer」入門 - Ohina Work
                                                    • 【研究開発部の技術】第1回 Sansanの名刺データ化技術 - Sansan Tech Blog

                                                      研究開発部 Architectグループの堤と申します。今年4月より、まったくの門外漢だったところから研究開発部でマネジメントを担当することになりました。入社して早6カ月が経とうとしていますが、マネジメントの面でも技術面でもまだまだ学ぶことだらけです。キャッチアップしたことの整理も兼ねて、これからしばらくの間、研究開発部の技術や成果物について紹介する記事を書いていきたいと思います。 まず第一弾として、本記事ではSansanの名刺データ化フロー 1 の中で使われている研究開発部の技術についてご紹介します。 2 切り出し(背景分離) 物体検出・セグメンテーション技術を用いて、背景から名刺を切り出します。 こちらは、スマホのカメラ経由で名刺を取り込む場合は、オンデバイスで処理を行っています。こちらについてはまた記事を書きたいと思っています。(弊社ではこの技術を「Smart Captured」略して

                                                        【研究開発部の技術】第1回 Sansanの名刺データ化技術 - Sansan Tech Blog
                                                      • 無料でできる!PHPで画像からテキストを読み取る方法

                                                        さてさて、このブログでは【Laravel + Google vision API】ウェブカメラで名刺を読みとって会員データ入力という記事を公開しています。 これはGoogle Vision APIを使って画像から文字を取得するという内容なのですが、実はこのサービスは有料になっています。(ただし、実行回数が少なければ無料でいけますし、基本的に料金は安いです) 正直なところ、精度を問われると間違いなくこういったクラウドのサービスを使うべきだと思いますが、もしかすると「精度は落ちてもいいので無料でやりたい」という需要があるのかなとも思いましたので、今回PHPを使って画像からテキストを読み取る(OCR)を無料でできる方法を紹介することにしました。 というのも、これも以前公開したネットカフェ向けにコミックをどこまで読んだか記録するLINEボットをつくったという記事でつくったBotは、基本的にバーコー

                                                          無料でできる!PHPで画像からテキストを読み取る方法
                                                        • https://github.com/orgs/ndl-lab/repositories?type=all

                                                            https://github.com/orgs/ndl-lab/repositories?type=all
                                                          • PC-8001を懐かしむページ

                                                            最近はOCRの性能が上がって、ダンプリスト入力(マシン語ゲームの入力)が非常に楽になりました。ただ、やっぱり間違いはあるので、 チェックサムを計算して修正作業は人間の手で必要です。 エミュ上でチェックサムを計算して、仮想プリンタに印刷してと、行ったり来たりの部分を効率化したいと考えてツールを作ってみました。 このツールを使うと、Windows上だけで、サムチェック、修正、cmt/t88/d88/p6t/mzt/cas/l3/pbf/wavファイル作成までができるようになります。 →DumpListEditorのダウンロードはこちらから(PC-6001、MZ-80K、MSXにも対応しました) 最初、Googleドライブ(詳しくは、ここなど)のOCR機能を使うことを考えていたのですが、普通の文の認識率はすごいのですが、ダンプリストの認識となるとなかなか厳しいようです。(文字種を16進で使う文字

                                                            • OCR with Keras, TensorFlow, and Deep Learning - PyImageSearch

                                                              PyImageSearch You can master Computer Vision, Deep Learning, and OpenCV - PyImageSearch In this tutorial, you will learn how to train an Optical Character Recognition (OCR) model using Keras, TensorFlow, and Deep Learning. This post is the first in a two-part series on OCR with Keras and TensorFlow: Part 1: Training an OCR model with Keras and TensorFlow (today’s post)Part 2: Basic handwriting rec

                                                                OCR with Keras, TensorFlow, and Deep Learning - PyImageSearch
                                                              • PDF内の画像からOCR機能でテキストを生成する方法

                                                                領収書などをPDFファイルで受け取った際、社内システムに入力したり、集計したりするため、PDF内の金額などの文字列をコピーすることも多いのではないだろうか。ただ、PDFファイルによっては、文字列がコピーできず、PDFを見ながら仕方なく手動で入力していることもあると思う。手動で入力すると、手間がかかるうえに、間違えも発生しやすい。 また、こうしたPDFファイルは、Tech TIPS「PDFファイルをWord/Excelファイルに変換して編集する方法」でファイルの変換を試しても、変換できないことが多い。 こうした文字列がコピーできないPDFは、PDFの中身が画像になっていることが多いので、OCR(光学的文字認識)機能を使って画像から文字を読み取らせるとよい。その方法を幾つか紹介しよう。 OneNoteを使ってPDFから文字列を抽出する

                                                                  PDF内の画像からOCR機能でテキストを生成する方法
                                                                • Azure Computer Vision APIでテキスト抽出(Read API)やーる(Python3.6) - Qiita

                                                                  import json import os import os.path import sys import requests import time import matplotlib.pyplot as plt from matplotlib.patches import Polygon from PIL import Image from io import BytesIO # import cv2 subscription_key = "<your subscription key>" endpoint = "<your API endpoint>" # endpoint = "https://japanwest.api.cognitive.microsoft.com/" text_recognition_url = endpoint + "vision/v3.1/read/ana

                                                                    Azure Computer Vision APIでテキスト抽出(Read API)やーる(Python3.6) - Qiita
                                                                  • ビジネス文書を無料で電子保存できる、AI-OCR搭載電子帳簿保存ソリューション「sweeep Box」をリリース

                                                                    sweeepは、ビジネス文書のオンライン受取や改正電子帳簿保存法に対応した保管機能をもつ、新サービス「sweeep Box」を提供開始しました。 このAIニュースのポイント sweeepは、ビジネス文書など、改正電子帳簿保存法に対応した保管機能をもつ、「sweeep Box」を提供開始 オンラインで簡単に書類を受け取れ、かつ電子帳簿保存法に則って適切に保管することが可能 読み取り精度が98.53%のAI-OCRが搭載され、紙の電子データ化も可能 請求書自動化AIを運営するsweeep株式会社は、ビジネス文書のオンライン受取や改正電子帳簿保存法に対応した保管機能をもつ、新サービス「sweeep Box」を正式に提供開始。「sweeep Box」はビジネス文書のオンライン受取と電子保管に特化した新サービスです。 sweeep Boxを使えば、わざわざ出社しなくても、いつでもどこでも簡単に書類を

                                                                      ビジネス文書を無料で電子保存できる、AI-OCR搭載電子帳簿保存ソリューション「sweeep Box」をリリース
                                                                    • 請求書OCR自動化: Document AI + ChatGPT API で非構造化データを JSON で出力させる - GMOインターネットグループ グループ研究開発本部

                                                                      2023.10.05 請求書OCR自動化: Document AI + ChatGPT API で非構造化データを JSON で出力させる はじめに こんにちは。グループ研究開発本部 次世代システム研究室のT.D.Qです。 2023年10月よりインボイス制度が開始されます。この制度に対応するため、請求書のOCR自動化はますます重要となっています。今回は、ChatGPTとDocumentAIの力を結集し、インボイス制度への対応を加速する請求書OCR自動化の方法について探ってみたいと思います。 1.やりたいこと 目的: 非構造化データを OCR で取得して、指定の JSON 形式で出力させたい 使用する技術: OpenAIのChatGPT及びGoogleのDocumentAI 実現手段: DocumentAIで請求書(PDF形式)を読み取り ChatGPTでDocumentAIのレスポンスから

                                                                        請求書OCR自動化: Document AI + ChatGPT API で非構造化データを JSON で出力させる - GMOインターネットグループ グループ研究開発本部
                                                                      • https://twitter.com/yag_ays/status/1521348285687951362

                                                                          https://twitter.com/yag_ays/status/1521348285687951362
                                                                        • Tesseract OCR VS EasyOCR|猩々博士

                                                                          はじめにAITuberとノベルゲームを共に楽しむために、ゲーム内のテキストを読み取り、AITuberが読み上げるシステムの構築を目指しています。 この記事では、Pythonで利用可能な複数のOCR(光学文字認識)ライブラリを試し、それぞれの認識精度と性能を比較してみました。 OCRライブラリの選定今回検証したライブラリは以下の通りです: Tesseract OCR: オープンソースで広く使われているOCRエンジン。 EasyOCR: ディープラーニングに基づく別の人気OCRツール。 認識テストに用いた画像テスト画像1: ゲームスクリーンショットをトリミングのみ実施 ドキドキ文芸部よりテスト画像2:画像1を画像処理したデータ 白ピクセル以外を塗りつぶし実装とテストPython環境でこれらのライブラリを実装し、同じノベルゲームのスクリーンショットを使ってテストを行いました。主な焦点は、認識精度

                                                                            Tesseract OCR VS EasyOCR|猩々博士
                                                                          • LayoutParserによるドキュメントレイアウトを意識したOCR解析 - OPTiM TECH BLOG

                                                                            R&D チームの徳田(@dakuton)です。 過去記事に引き続き、今回もテキスト抽出をさくっといい感じにしようシリーズです。 前回記事 tech-blog.optim.co.jp LayoutParserとは 物体検出を追加利用したドキュメント向けレイアウト解析ツールです。 (GitHub)Layout-Parser/layout-parser (arXiv)LayoutParser: A Unified Toolkit for Deep Learning Based Document Image Analysis 各種OCRのロジックとして物体検出がすでに組み込まれているケースも多数ありますが、それとは別途、大まかなレイアウトに対する物体検出結果を合成し、意味のあるまとまりのテキストで補正抽出することが可能です。 オプションインストール(OCR向け)を含めた場合、LayoutParse

                                                                              LayoutParserによるドキュメントレイアウトを意識したOCR解析 - OPTiM TECH BLOG
                                                                            • ダンプリストをOCR! - レトロパソコンであそぼう!

                                                                              今も細々と開発中のダンプリスト入力ツール! pocketgriffon.hatenablog.comダンプリストも、基本的には手入力が好きな私。 OCRで文字認識をさせてみても、その間違いを探してどうせ256バイト全部見るくらいだったら、最初から手で打ち込んだ方が早いじゃん…と思ってしまってる。 2017年に一度だけOCRに挑戦してみたが、この時は4%くらいの間違いで済んでいた。このくらいの間違い率だったら使ってみても良いかな…と思っていたが、この当時使っていたタブレットのカメラが高性能だったのか、iPhoneに変えてからはだいぶ間違いが多い。 あの時は既存のツールを使うだけの方法だったけど、今回は認識率を上げるために自分で努力してみる事にした! どんなツールがある? 今までOCRのツールに何があるのかなんて気にした事もなかった…。 真っ先に出てきたのが、Google DriveによるOC

                                                                                ダンプリストをOCR! - レトロパソコンであそぼう!
                                                                              • AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 | IT Leaders

                                                                                IT Leaders トップ > 経営課題一覧 > 業務改革 > 新製品・サービス > AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 業務改革 業務改革記事一覧へ [新製品・サービス] AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 2021年12月20日(月)日川 佳三(IT Leaders編集部) リスト AI insideは2021年12月20日、AI-OCRサービス「DX Suite」を強化したと発表した。読み取れる非定型帳票モデルを増やし、新たに保険加入時に発行する「保険証券」を読み取れるようにした。過去に販売した保険内容のデータベース化を支援する。こうしてデータベース化したデータは、新たなプランの提案などに役立つ。 DX Suiteは、クラウドサービス型のAI-OCR(光学文字認識)ソフト

                                                                                  AI-OCR「DX Suite」が保険証券に対応、保険証券の33項目を読み取ってテキスト化 | IT Leaders
                                                                                • QuickOCR

                                                                                  Quick OCR is a tool that recognize text using OCR included in the range selected on the screen with the mouse. 画面上任意の範囲を選択してOCRすることができます。 選択した範囲が表になっている場合はExcelコピー可能な表形式に出力可能です。 (罫線が淡色の場合や背景色が濃い場合、余白が大きい場合は表として正しく認識されません) 日本語、英語の両方の言語設定でOCRします。 Windows10の標準のOCRエンジンを使用しています (このため、認識精度は無いよりマシというレベルです)。 範囲選択モードで起動することで初期画面をスキップすることができます。 範囲選択モードでの起動方法はこちら You can select any range on the screen and pe