並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 297件

新着順 人気順

ocrの検索結果241 - 280 件 / 297件

  • GitHub - robertknight/ocrs: Rust library and CLI tool for OCR (extracting text from images)

    ocrs is a Rust library and CLI tool for extracting text from images, also known as OCR (Optical Character Recognition). The goal is to create a modern OCR engine that: Works well on a wide variety of images (scanned documents, photos containing text, screenshots etc.) with zero or much less preprocessing effort compared to earlier engines like Tesseract. This is achieved by using machine learning

      GitHub - robertknight/ocrs: Rust library and CLI tool for OCR (extracting text from images)
    • #PowerAutomate Desktop の OCR アクションを試してみた - Qiita

      Power Automate Desktop とは ローコード開発プラットフォームの Power Platform のうち自動化を担当する Power Automate ですが、APIがない、既存のデスクトップアプリケーションやWebサービスなども、クラウド連携したいという要望に応えるために、RPA機能として追加されたものが、Power Automate Desktop です。 このような形で、アプリケーションの操作を指定し、クラウドサービスである、Power Automate から呼び出し、実行結果を取得することで、既存のアプリケーションも簡単にクラウド連携ができるようになりました。 Power Automate Desktop は、アプリケーションの代行操作以外にも、様々なアクションが用意されています。 その中で、OCRというアクションがあるので開いてみましょう。 アクションを見る限り

        #PowerAutomate Desktop の OCR アクションを試してみた - Qiita
      • インターンとしてOCR処理の実装および精度上昇に尽力した話 - Retty Tech Blog

        タイトルの通り、8/10-27の3週間Rettyの広告コンテンツチームでインターンをさせていただきました。かなりたくさんのことを行い、考えてきたので思考プロセスって言ったら大げさなんですけど笑備忘録を書かせていただきます。 自己紹介 インターンのタスク タスクの目的 具体的な内容 手法の選定 Vision APIの使用について 機械学習モデルの構築 学習用画像のアノテーション 機械学習の前準備 ResNetとは? 学習スタート! 推論 Endpoint 作成 OCRを行う 形態素解析とは 形態素解析を行った 今後の方向性 今回使用しなかったデータへの範囲拡大 OCRのパラメータについて インターン中の業務以外に関して 感想 Rettyでインターンをしたい人へ 最後に 自己紹介 東京工業大学大学院情報理工学院 数理・計算科学系1年生の森脇と申します。大学院の方では分散学習の研究を行っておりま

          インターンとしてOCR処理の実装および精度上昇に尽力した話 - Retty Tech Blog
        • 検索可能になっていないPDFを、ScanSnap付属アプリでOCR処理をして検索可能なPDFにする方法(ScanSnapでスキャンした1ページのPDFにJPGとして追加してからOCR処理する)

          検索可能になっていないPDFを、ScanSnap付属アプリでOCR処理をして検索可能なPDFにする方法(ScanSnapでスキャンした1ページのPDFにJPGとして追加してからOCR処理する) 前提 Mac MacBook Pro macOS Big Sur ScanSnap 富士通 PFU ドキュメントスキャナー ScanSnap iX1600 (ホワイト/両面読取/ADF/4.3インチタッチパネル/Wi-Fi対応) - Amazon.co.jp 問題 検索可能になっていないPDF(ScanSnap以外で作成された画像のみのPDF)は、そのままではScanSnap付属アプリでOCR処理できない。 解法 ScanSnapでスキャンした1ページのPDFを用意しておき、そこにOCR処理したい全ページをJPGとして挿入したPDFを作ってから、それをOCR処理すればいい。 手順 ScanSnapで

            検索可能になっていないPDFを、ScanSnap付属アプリでOCR処理をして検索可能なPDFにする方法(ScanSnapでスキャンした1ページのPDFにJPGとして追加してからOCR処理する)
          • https://jp.techcrunch.com/2021/09/30/021-09-29-google-introduces-a-new-way-to-search-that-combines-images-and-text-into-one-query/

              https://jp.techcrunch.com/2021/09/30/021-09-29-google-introduces-a-new-way-to-search-that-combines-images-and-text-into-one-query/
            • AI-OCRとは?OCRとの違いや種類・導入メリット・比較のポイントを解説

              AIとOCR技術を組み合わせたソリューションがビジネスプロセスの自動化と効率化を推進しています。この技術は、手書きや活字の文書からテキストデータを正確に読み取り、デジタル化することで、手作業によるデータ入力の時間とコストを大幅に削減します。 また、RPA(ロボティック・プロセス・オートメーション)と連携することで、業務効率化がさらに進みます。デジタル変革(DX)を推進する上で、業務効率を向上させることが可能です。 本記事ではAI-OCRの特徴やメリット、デメリットや製品の比較ポイント等を紹介します。この記事がAI-OCR導入を検討している方々に有用な情報を提供できれば幸いです。 AI-OCRとは? AI-OCRとは、AI(人工知能)を活用したOCR(光学的文字認識)のことを指します。OCRとは、スキャナなどで読み込んだ画像に描かれた文字をテキストデータに変換する技術です。AI-OCRはOC

                AI-OCRとは?OCRとの違いや種類・導入メリット・比較のポイントを解説
              • Zaim、購入内容の詳細を残せる「レシート履歴置換」。クレカとレシート情報を紐付け

                  Zaim、購入内容の詳細を残せる「レシート履歴置換」。クレカとレシート情報を紐付け
                • 画像やドキュメントファイルからAIでテキストを抽出するオープンソースのOCRツール・「EasyOCR」 - かちびと.net

                  EasyOCRは画像やドキュメントファイルからAIでテキストを抽出するオープンソースのAI-OCR(Optical Character Recognition)ツールです。80ヵ国以上の言語がサポートされています。もちろん日本語も含まれています。 身近なものだとGoogleドライブにもOCR機能が付いていますね。同じように、任意の画像やドキュメントからテキストをアップロードし、抽出したい言語を指定(英語ならen、日本語ならja)するだけでテキストに変換してくれます。 また、回数を重ねる事で学習し、より高い精度になっていくよう設計されているそうです。pythonで書かれています。ブラウザで動作確認もできますので精度をお試しになってみてはいかがでしょう。ライセンスはApache-2.0との事。 EasyOCR

                  • [Python] PDFをOCR処理して、テキスト埋め込みPDFを作成する - Qiita

                    import os import sys import time import threading import subprocess from pdf2image import convert_from_path import tkinter as tk from tkinter import ttk from tkinter import messagebox from tkinter import filedialog from tkinter import scrolledtext class Application(tk.Frame): def __init__(self, master=None): super().__init__(master) self.master.geometry('500x330') self.master.title('PDF OCR') self

                      [Python] PDFをOCR処理して、テキスト埋め込みPDFを作成する - Qiita
                    • 読取革命Ver.17

                      12年連続 販売本数シェア No.1 2013 ~ 2024年(1月~ 12月)全国の有力家電量販店販売実績データの「PCソフト/ビジネス」、「OCR・翻訳」カテゴリを抽出して自社集計 「読取革命」は書類のスキャン画像などの文字画像を編集可能なテキストデータに変換するソフトです。 搭載するOCR(Optical Character Recognition)エンジンの精度の高さには定評があり、企業を中心に多くのユーザーに使われています。 FAXやコピーした文書、手書き文字など低品質文字の認識に強く、英語文書の読み取りにも対応しています。 「AIトータルアシスト」は、ChatGPTと連携することで、従来のOCR機能に留まらない多様な機能を提供します。 OCRの誤認識を自然な文に修正したり、文章を瞬時に要約することで、業務効率が大幅に向上し、時間の節約につながります。 これにより、「読取革命 V

                        読取革命Ver.17
                      • 熊本大学とTOPPAN、くずし字対応のAI-OCRを用いて「細川家文書」約5万枚の全文テキスト化に成功

                          熊本大学とTOPPAN、くずし字対応のAI-OCRを用いて「細川家文書」約5万枚の全文テキスト化に成功
                        • ndl-lab

                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                            ndl-lab
                          • Windows 11のSnipping Tool、画面からテキストをコピーする機能登場

                            BetaNewsは2月21日(米国時間)、「Microsoft is giving Snipping Tool a major OCR upgrade in Windows 11」において、Windows 11の画面キャプチャーアプリ「Snipping Tool」が強化されると伝えた。 従来のOCR(Optical Character Recognition:光学文字認識)が進化し、スクリーンショットを撮らずにテキストの抽出が可能になるとのことだ。 Microsoft is giving Snipping Tool a major OCR upgrade in Windows 11 Snipping ToolのOCRが進化 Windowsの「Snipping Tool」は画面やウィンドウのスナップショットおよび録画を可能にする画面キャプチャーアプリだ。録画したデータは画像や動画ファイルとし

                              Windows 11のSnipping Tool、画面からテキストをコピーする機能登場
                            • LayoutParserによるドキュメントレイアウトを意識したOCR解析 - OPTiM TECH BLOG

                              R&D チームの徳田(@dakuton)です。 過去記事に引き続き、今回もテキスト抽出をさくっといい感じにしようシリーズです。 前回記事 tech-blog.optim.co.jp LayoutParserとは 物体検出を追加利用したドキュメント向けレイアウト解析ツールです。 (GitHub)Layout-Parser/layout-parser (arXiv)LayoutParser: A Unified Toolkit for Deep Learning Based Document Image Analysis 各種OCRのロジックとして物体検出がすでに組み込まれているケースも多数ありますが、それとは別途、大まかなレイアウトに対する物体検出結果を合成し、意味のあるまとまりのテキストで補正抽出することが可能です。 オプションインストール(OCR向け)を含めた場合、LayoutParse

                                LayoutParserによるドキュメントレイアウトを意識したOCR解析 - OPTiM TECH BLOG
                              • 【TIPS】海外フリゲを自動翻訳しながら遊ぶ手順(Screen Translator, PCOT)|ソルト

                                英語は苦手だけど気になるゲームがあるという悩みに応えてくれる素敵なソフトについて使用手順などをメモします。次の2つのソフトを触りました。どちらも無料で使用できます。制作者様に感謝。ヘビーユーズするようなら寄付などしたいです。 ①Screen Translator たぶん定番なソフトだと思います。海外の方が開発しているので、「英語が全くわからん」という場合は使いにくいですが、「アイキャンノットスピークイングリッシュ(ちょっとだけ分かる)」という場合の補助としては十分な機能だと感じました。 ②PCOT 2020年ごろに個人で開発されたソフトみたいです。一時期は配布が制限されていましたが、2021年7月現在は配布が再開しています。各所で話題になっている通り、使いやすいです。また、設定画面などが全て日本語なのもありがたいです。おススメ。 ◆はじめに◇そもそも何のために使うものなの? 「遊びたいゲー

                                  【TIPS】海外フリゲを自動翻訳しながら遊ぶ手順(Screen Translator, PCOT)|ソルト
                                • Tesseract OCR VS EasyOCR|猩々博士

                                  はじめにAITuberとノベルゲームを共に楽しむために、ゲーム内のテキストを読み取り、AITuberが読み上げるシステムの構築を目指しています。 この記事では、Pythonで利用可能な複数のOCR(光学文字認識)ライブラリを試し、それぞれの認識精度と性能を比較してみました。 OCRライブラリの選定今回検証したライブラリは以下の通りです: Tesseract OCR: オープンソースで広く使われているOCRエンジン。 EasyOCR: ディープラーニングに基づく別の人気OCRツール。 認識テストに用いた画像テスト画像1: ゲームスクリーンショットをトリミングのみ実施 ドキドキ文芸部よりテスト画像2:画像1を画像処理したデータ 白ピクセル以外を塗りつぶし実装とテストPython環境でこれらのライブラリを実装し、同じノベルゲームのスクリーンショットを使ってテストを行いました。主な焦点は、認識精度

                                    Tesseract OCR VS EasyOCR|猩々博士
                                  • PDF編集ソフト「EaseUS PDF Editor」が販売開始 ~日本語OCR機能も搭載/ファイル形式の変換機能が充実。機能を制限した体験版も用意

                                      PDF編集ソフト「EaseUS PDF Editor」が販売開始 ~日本語OCR機能も搭載/ファイル形式の変換機能が充実。機能を制限した体験版も用意
                                    • GitHub - OneMoreGres/ScreenTranslator: Screen capture, OCR and translation tool.

                                      You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                        GitHub - OneMoreGres/ScreenTranslator: Screen capture, OCR and translation tool.
                                      • 【活用提案】「MS Office」のウェブ版とアプリ版の違いは? サブスクは必要? 自分に合った方法を見つけよう (1/3)

                                        【活用提案】「MS Office」のウェブ版とアプリ版の違いは? サブスクは必要? 自分に合った方法を見つけよう オフィス系アプリといったら真っ先に思い浮かべるのが「Microsoft Office」(以下、「MS Office」)だろう。パソコン向けのアプリとして圧倒的なシェアを誇り、ビジネスシーンではまさに定番。「Excel」や「Word」がなければ仕事にならないといった人も少なくないはずだ。 「MS Office」をiPadで使うにはいくつかの方法がある。しかし、その方法によって使える機能も異なるので、何がどのように使えるのかは知っておきたいところ。また、「MS Office」の機能をiPadでフル活用したいなら、「Microsoft 365」のサブスクリプション契約は必須だが、「Microsoft 365」には多様なライセンスが用意されていて、どれを選んだらいいかがわかりにくい。

                                          【活用提案】「MS Office」のウェブ版とアプリ版の違いは? サブスクは必要? 自分に合った方法を見つけよう (1/3)
                                        • 【2025年版】無料オープンソースのOCRソフトウェア10選を徹底比較!(PDFや画像からテキスト情報を抽出)

                                          企業内ではテキストデータのみならず、さまざまなバイナリデータがやり取りされます。良くあるのはPDFの帳票です。そうしたデータの中から必要な数字、テキストを抽出する際に便利なのがOCRです。 OCRを使うことで、PDFや画像からテキストが抽出できます。システム自動化を考える際に役立つので、覚えておきましょう。 macOCR macOS向けのコマンドで、任意の範囲を指定してテキストデータを抽出します。抽出されたテキストは標準出力の他、クリップボードにもコピーされます。 範囲の選択時にはマウスを利用するので、見た目にもわかりやすいですし、画像の一部からテキストを抜き出すのにも利用できます。 schappim/macOCR: Get any text on your screen into your clipboard. Tesseract OCR Tesseract OCRはGoogleが公開し

                                            【2025年版】無料オープンソースのOCRソフトウェア10選を徹底比較!(PDFや画像からテキスト情報を抽出)
                                          • GitHub - amebalabs/TRex: Copy any text on your screen, stop retyping.

                                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                              GitHub - amebalabs/TRex: Copy any text on your screen, stop retyping.
                                            • OCRツールをまとめた「AI-OCRカオスマップ」が公開

                                              株式会社アイスマイリーはアナログの書類や帳票をデジタルに変換するOCRツールをまとめた「AI-OCRカオスマップ」を2021年4月19日に公開した。掲載数は合計104サービス。 OCRの製品・サービスにはツールによって機能や実現できる内容に違いがあるので、自社の課題は何か、どんな結果を実現したいのかという観点から、それぞれのツールの違いを充分に比較検討することが重要だ。OCRは、書類はもちろん、請求書などの帳票、名刺やナンバープレート、彫刻文字もいろいろなものをデジタル変換できる。RPAを駆使して、自社の基幹システムに処理したデータを出力するなど、活用シーンによって選択するOCRツールも異なる。 今回のカオスマップは、「AI-OCRを試したい」という人から「最新のOCRツールを探している」という人に向け、AIsmileyが独自の主観で、104の製品サービスを取りまとめ、マッピングしたものだ

                                                OCRツールをまとめた「AI-OCRカオスマップ」が公開
                                              • 文書要約|AI文章要約|文章|要約|論文|AI

                                                このサイトでは文書要約機能を提供しております。

                                                • OCR実装など機能拡張が続くWindows標準アプリ - 阿久津良和のWindows Weekly Report

                                                  レポート OCR実装など機能拡張が続くWindows標準アプリ - 阿久津良和のWindows Weekly Report Windows 10時代は「切り取り領域とスケッチ」に置き換わる予定だったSnipping Toolだが、ここに来て機能強化を重ねている。たとえば2023年の年初には動画撮影に対応。筆者は業務で動画ファイルを使用する場面はほぼないため、検証以上には使い込んでいないが、便利に活用しているユーザーもいるだろう。 安定版Windows(ビルド22621.2283)のSnipping Tool Snipping Toolが続いて搭載する新機能は、OCRだ。公式ブログによると、ディスプレイに映し出されたアプリやスクリーンショットから任意の範囲を指定すると、その内容をテキスト化してクリップボードに取り込み、ほかのアプリで利用できるというもの(もちろんテキスト化が可能なものに限られ

                                                    OCR実装など機能拡張が続くWindows標準アプリ - 阿久津良和のWindows Weekly Report
                                                  • PDFを簡単に文字起こしする方法を徹底解説!便利な文字起こしツール10選もあわせて紹介

                                                    現在はデジタル化が進み、紙の文書ではなくPDFファイルの形式が主流となっていますが、PDFや画像内の文字をテキストとして取り出したいケースもあります。 しかし、PDFをすべて手入力で文字起こしするのは面倒ですよね。そんな時に便利な、PDFや画像の文字をテキスト化してくれるツールがあるのをご存知ですか? この記事では、PDFや画像内の文字を自動でテキスト化できる、便利な文字起こしツールについてまとめました。 PDFや画像を文字起こしするメリットPDFや画像のテキストを文字起こしすることで得られるメリットはたくさんあります。 具体的にどのようなメリットがあるか、詳しく見てみましょう。 手入力する手間が省ける PDFや画像内の文章を手入力で文字起こしする労力と時間が省けるので、効率化と生産性の向上を図れます。 データとして保管しておける 紙の資料のままだと破けたり紛失したりしてしまうこともありま

                                                      PDFを簡単に文字起こしする方法を徹底解説!便利な文字起こしツール10選もあわせて紹介
                                                    • Mistral OCR

                                                      Mistral OCR (via) New closed-source specialist OCR model by Mistral - you can feed it images or a PDF and it produces Markdown with optional embedded images. It's available via their API, or it's "available to self-host on a selective basis" for people with stringent privacy requirements who are willing to talk to their sales team. I decided to try out their API, so I copied and pasted example cod

                                                        Mistral OCR
                                                      • Azure updates | Microsoft Azure

                                                          Azure updates | Microsoft Azure
                                                        • NormCap - k本的に無料ソフト・フリーソフト

                                                          画面内に写っている文字列を、プレーンテキストとしてコピー可能にするシンプルな OCR ツール。 マウスドラッグで囲んだ領域内に写っている文字列を、プレーンテキストとしてクリップボードにコピーできるようにしてくれます。 NormCapは、クロスプラットフォーム(Windows / Linux / MacOS)に対応した OCR ツールです。 オープンソースの OCR エンジン “ Tesseract ” を利用したシンプルな OCR ツールで、画面内に写っている文字列を簡単な操作でクリップボード内にコピーできるようにしてくれます。 ソフトを実行すると即キャプチャが開始され、そのまま読み取りたい文字列をマウスドラッグして囲むだけで使えるようになっています※1。 1 ただし、デフォルトでは日本語の読み取りに対応していないので、日本語テキストを読み取りたい場合は少々設定が必要となる。 画像内に写っ

                                                            NormCap - k本的に無料ソフト・フリーソフト
                                                          • Vision API OCR事始め(2):検出されたテキストの階層構造(fullTextAnnotation)

                                                            大福好きの甘党ソフトウェアエンジニア(主に業務システム系)である『テクノ大福』のブログです。面白そうな技術、影響を受けた本や音楽などを共有したいと思っています。

                                                              Vision API OCR事始め(2):検出されたテキストの階層構造(fullTextAnnotation)
                                                            • シナモンAI、第三者割当増資により第一生命から5億円資金調達を実施

                                                              このAIニュースのポイント シナモンAIが第一生命保険株式会社を引受先とする5億円の第三者割当増資を実施 保険金・給付金請求時に提出される診断書の手書き文字をテキスト化するAIを第一生命に提供 資金調達を通して第一生命社員のAI人材育成を支援し、保険業界全体のDX化に貢献 株式会社シナモンは、第一生命保険株式会社を引受先とする5億円の第三者割当増資を実施しました。 シナモンAIは、自然言語処理やAI-OCR、音声認識などのAI技術を組み合わせた様々な製品を展開する企業です。保険金・給付金請求時に提出される診断書の「医学用語が記載された手書き文字」をテキスト文字化するAI「Flax Scanner」を第一生命に提供しています。 非構造化データの活用は、第一生命のコンサルティングセールス面や契約管理のオペレーション面、あるいはコンプライアンス等の品質面において展開可能であり、シナモンAIはバリ

                                                                シナモンAI、第三者割当増資により第一生命から5億円資金調達を実施
                                                              • PaddleOCR - a Hugging Face Space by akhaliq

                                                                Discover amazing ML apps made by the community

                                                                  PaddleOCR - a Hugging Face Space by akhaliq
                                                                • Biblog | Quote-hunting App

                                                                  Biblog is a quote collection app designed for you to save the words that move your heart. Its usage is very simple. Just capture the words that catch your attention and select them. We will then save beautifully and make them easily searchable.

                                                                    Biblog | Quote-hunting App
                                                                  • MacでTesseract OCRを使って画像内のテキストを取り出してみる

                                                                    こんにちは、アルバイトの上野です。今回はOCRを使って画像中のテキストを文字として取り出すtesseractというオープンソースについて紹介します。 インストール まずはbrewでインストールします $ brew install tesseract 次のコマンドで対応している言語を確認できます $ tesseract --list-langs List of available languages (3): eng osd snum 日本語が入ってないので日本語の学習済みモデルを入れる必要があります。 公式ドキュメントによるとGithub https://github.com/tesseract-ocr/tessdata_best から jpn.traineddataとjpn_vert.traineddataをダウンロードする必要があるそうです。 ただし、実はこの学習済みモデルよりUbun

                                                                      MacでTesseract OCRを使って画像内のテキストを取り出してみる
                                                                    • Docling

                                                                      Docling. MIT licensed document extraction Python library from the Deep Search team at IBM, who released Docling v2 on October 16th. Here's the Docling Technical Report paper from August, which provides details of two custom models: a layout analysis model for figuring out the structure of the document (sections, figures, text, tables etc) and a TableFormer model specifically for extracting structu

                                                                      • Flutter+ML Kitで賞味期限とバーコードを高速&高精度OCR

                                                                        はじめに今回開発したのは、スマホのカメラで素早く、食料品のバーコードと賞味期限を正確に読み取ることが可能なアプリです。 このアプリによって、当社の健康専門店のような物流倉庫での、アナログな食品管理が簡易できるようになります。 アプリ概要とUXどんなアプリかをざっくり見てもらうため、メインとなるスマホ画面を4枚ほどスクショしてきました。 このアプリでは、商品バーコードと賞味期限の読み取り、編集が可能です。 (商品バーコードスキャン)⇒賞味期限のOCR⇒データ編集&送信で1つのフローとなります。 多量の商品を管理する場面を考慮し、最短2タップで1つの商品情報を送信可能なUXとしました。 また、薄暗い倉庫での使用を想定しているため、カメラ使用時にはデフォルトでフラッシュライトがOnになっています。 製作工程次のセクションでは、アプリを開発するに至った経緯と実装方法を記しておきます。 1. 現状の

                                                                          Flutter+ML Kitで賞味期限とバーコードを高速&高精度OCR
                                                                        • 【検証】iOS15新機能「テキストの認識表示」は日本語環境でどこまで使える? - iPhone Mania

                                                                          iOS15の新機能「テキストの認識表示」は、iPhoneのカメラで捉えた画像に含まれる文字を自動認識し、コピー&ペーストや検索に利用できます。残念ながら日本語に非対応ですが、iOS15のパブリックベータ3でどこまで使えるか、試してみました。 日本語非対応の「テキストの認識表示」 iOS15では、写真の中のテキストをコピー&ペーストや検索、翻訳できる「テキストの認識表示」(英語ではLive Text)機能が、A12 Bionic以降を搭載したiPhoneで利用可能になります。 Appleの発表では、「テキストの認識表示」が利用できる言語は英語、中国語、フランス語、イタリア語、ドイツ語、スペイン語、ポルトガル語の7言語で、残念ながら日本語は対応言語に含まれていません。 使えればとても便利そうな機能だけに、日本語に非対応なのは残念です。一部だけでも活用することはできないかと考え、日本語版のiOS

                                                                            【検証】iOS15新機能「テキストの認識表示」は日本語環境でどこまで使える? - iPhone Mania
                                                                          • iOS 14メモアプリの「スキャン機能」で書類をデータ化しよう! - 週刊アスキー

                                                                            iOS 14では、「メモ」アプリから書類をスキャンして保存することが可能です。使い方をチェックしましょう。 「メモ」を開くと、キーボードの上部にカメラのアイコンが確認できると思います。カメラのアイコンをタップし、ポップアップメニューから「書類をスキャン」をタップしましょう。 カメラが立ち上がるので、スキャンしたい書類にカメラを向けます。書類の範囲が自動的に選択され、薄い黄色で表示されます。スキャン時、書類を置く場所は、書類とはっきり色が異なる方が、うまくスキャンしやすいようです。 シャッターが自動的に切れるので、うまく撮れている場合は「スキャンを保持」を、撮影しなおしたい場合は「再撮影」をタップ。 「スキャンを保持」を選択すると、右下に「保存」というボタンが表示されるので、タップすると、スキャン済みの書類が保存されます。連続で複数前の書類をスキャンし、まとめて保存することも可能です。

                                                                              iOS 14メモアプリの「スキャン機能」で書類をデータ化しよう! - 週刊アスキー
                                                                            • 【開催報告】AWS Summit Japan 2025 物流業界向けブース展示 「倉庫 x OCR x 生成 AI エージェント」 | Amazon Web Services

                                                                              Amazon Web Services ブログ 【開催報告】AWS Summit Japan 2025 物流業界向けブース展示 「倉庫 x OCR x 生成 AI エージェント」 6月 24 日と 25 日の 2 日間にわたり、幕張メッセにおいて 14 回目となる AWS Summit Japan が開催され、会場では約 3 万人の方々にご参加いただきました。本イベントでは 90 のセッションと 174 のブース展示が行われ、AWS の最新情報が共有されました。 物流業担当チームでは「倉庫 x OCR x 生成 AI エージェント」と題したデモ展示を行いました。この展示は物流業のみならず、製造業や小売業など倉庫業務に関心をもつ多くの方々にご来場いただき、生成AIによる OCR 読み取りの高精度さや生成AI エージェントを活用した業務高度化について大きな反響をいただきました。本ブログでは、展

                                                                                【開催報告】AWS Summit Japan 2025 物流業界向けブース展示 「倉庫 x OCR x 生成 AI エージェント」 | Amazon Web Services
                                                                              • LegalForce、シリーズDラウンドにおいて総額約137億円を資金調達

                                                                                LegalForceは、シリーズDラウンドにおいて総額約137億円の資金調達を実施しました。これによりエクイティによる累計資金調達額は約179億円になりました。 このAIニュースのポイント LegalForceがシリーズDラウンドにおいて総額約137億円の資金調達を実施 AIが契約書を解析し自動で台帳を作成する「LegalForceキャビネ」を展開 今回の資金調達で新たにSoftBank Vision Fund2、Sequoia China、Goldman Sachsが参画 株式会社LegalForceは、シリーズDラウンドにおいて総額約137億円の資金調達を実施します。これによりエクイティによる累計資金調達額は約179億円になります。 LegalForceは弁護士の法務知見と自然言語処理技術や機械学習などのテクノロジーを組み合わせ、企業法務の質の向上、効率化を実現するソフトウェアの開発・

                                                                                  LegalForce、シリーズDラウンドにおいて総額約137億円を資金調達
                                                                                • AzureのOCRサービス「Azure Form Recognizer」入門 - Ohina Work

                                                                                  AzureのOCRサービス「Azure Form Recognizer」入門 注意 サービス名称に伴い最新版の記事はこちらに記載しました。 https://ohina.work/post/azure_ocr_di/#google_vignette はじめに Azureには、Azure Cognitive ServicesとAI機能をWeb APIして提供するサービスがあります。 本記事では、Azure Cognitive Servicesのうち、OCRサービス「Azure Form Recognizer」の使い方について紹介します。 Azure Cognitive Servicesとは Azure Cognitive Servicesは、視覚、音声、言語、決定、検索の5ジャンルからなるAI機能をWeb APIとして利用できるAzureのサービスです。 https://azure.micro

                                                                                    AzureのOCRサービス「Azure Form Recognizer」入門 - Ohina Work

                                                                                  新着記事