並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 412件

新着順 人気順

OCRの検索結果41 - 80 件 / 412件

  • 知らなくて損してた!OCRがGoogleドライブで手軽にできる方法!

    令和の時代になっても、手渡しで配られる小学校のプリント、届くFAXはWordで書いたものをわざわざ印刷したもの、メールに添付された資料は印刷したエクセルをPDF化したもの…もううんざりですよね。 テキストのデータでぽんともらえれば早く済む仕事も、画像データで来てしまうともう一度パソコンに打ち直す必要があります。普段パソコンで仕事をしている人なら、このような事態に何度か直面したことがあるでしょう。 もちろん、「テキストデータで送って!」と言えれば、何の問題もありません。しかし相手が上司やお客さんだとなかなか言えませんし、勇気を出して伝えても、「テキストデータ?きょーゆーふぉるだ?よくわかんないけど、データは送ったよ☆」となることが多く、この悩みは尽きそうにありません。 そんなときは、画像データをテキストデータに変換できる「OCR」がおすすめです!OCRソフトには色々あり、一昔前は有償のものが

      知らなくて損してた!OCRがGoogleドライブで手軽にできる方法!
    • 古文書を解読できるiOSアプリ、凸版印刷が無料配信 手書きや木版のくずし字に対応 解読率は90%

      凸版印刷(東京都文京区)は6月1日、くずし字解読アプリ「古文書カメラ」(iOS)の配信を始めた。AI-OCR技術を活用したアプリで、スマートフォンで撮影したくずし字をその場で解析できる。アプリのインストールは無料、解読機能は、1日に10回まで利用可能。 書簡などの手書きと木版印刷で作られた版本、それぞれのくずし字に対応したAI-OCRエンジンを搭載しており、解読率は90%に及ぶという。AIが全ての文字を自動で検出し、解読する「フルオートモード」と、文字候補を提案することでさらに詳細な解読を可能にする「範囲選択モード」を備える。 もしAIの解読結果が間違っていた場合、ユーザーが修正できる。修正内容はAIが再学習し、解読精度を向上させられるという。解読結果は画像とテキストデータで保存可能。 同社ではこれまでも古文書解読事業を進めており、今回のアプリもその一環。古文書のほとんどはくずし字で書かれ

        古文書を解読できるiOSアプリ、凸版印刷が無料配信 手書きや木版のくずし字に対応 解読率は90%
      • マカフィー、テスラ車をダマしてスピード違反させることに成功

        マカフィー、テスラ車をダマしてスピード違反させることに成功2020.03.01 09:0031,672 岡本玄介 人の目には真ん中がちょっと長い3なのに、機械は8に勘違いするって。 セキュリティーソフトでお馴染みのMcAfee(マカフィー)が、Tesla(テスラ)車を騙すちょっとしたハッキング動画を投稿しました。 それは時速35マイルの速度標識にちょんと黒いテープを貼ると、車が制限速度を時速85マイルに勘違いしてしまう、というものです。 Video: McAfee/YouTubeテープはたった5cmで、遠目で見てもそんなに8には見えないと思うのですが…Tesla車い搭載された「MobilEye EyeQ3」カメラは勘違いして、自動的に時速85マイルに向かって加速してしまったのでした。 ちょっと古い2車種が間違えたMIT Technology Reviewによりますと、、McAfeeがこのテ

          マカフィー、テスラ車をダマしてスピード違反させることに成功
        • 深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era

          ■イベント 
:【SenseTime Japan × Sansan】画像処理勉強会 https://sansan.connpass.com/event/230636/ ■登壇概要 タイトル:深層学習時代の文字認識とその周辺 発表者: 
技術本部 DSOC R&D研究員  宮本 優一 ▼Twitter https://twitter.com/SansanRandD

            深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era
          • 紙の書類を高精度にテキストデータ化できる無料Webサービス『Free Online OCR』【今日のライフハックツール】 | ライフハッカー・ジャパン

            取引先から送られてきたFAXや、印刷文書などをテキストデータ化したいこと、ありますよね。 カメラやスキャンアプリで画像化する手もありますが、画像のままだとスマートフォン上で確認したい場合や、内容を抜粋したい場合に扱いにくいのです。 ちなみに、個人的に過去最悪レベルで困ったのは、「セキュリティの問題で、データの状態では渡せない」と言われて紙の名簿を渡され、数百件分を宛名印刷するという、悪夢のような仕事でした…。 OCR(文字認識)アプリは、こんなときに役立つもの。 今回は、筆者が知る限り、無料サービスの中で最高レベルの識字精度を誇るWebサービスをご紹介します。 Screenshot: 田中宏和『Free Online OCR』はインターフェイスが英語ですが、単ページで完結できるシンプルな使い勝手なので、英語が苦手な人でも使いやすいWebサービス。 プライバシーポリシーには以下の点が記載され

              紙の書類を高精度にテキストデータ化できる無料Webサービス『Free Online OCR』【今日のライフハックツール】 | ライフハッカー・ジャパン
            • 簡単に利用できる PDF 文字認識 OCR 比較まとめ ~ AI OCR の頭抜けた実力 - GMOインターネットグループ グループ研究開発本部

              D.M.です。今回は RPA にて PDF を OCR で読み取る検証をしたお話です。 TL;DR ・実用性は AI OCR しか勝たん。 ・AI OCR は Google vs Microsoft の構図。 両者精度高。 ・Google も Microsoft も API に無料枠があり Python などのプログラムで連携できる。 ・Microsoft は有料の RPA 連携機能が超絶楽勝なのでコードを書かない前提ならこっちも選択肢。非エンジニアでも楽々自動化できる。 ※関連記事 AI OCR でクレカ読み取りをやっています。 スマホNativeアプリでクレジットカード番号の読み取り機能の技術検証結果まとめ https://recruit.gmo.jp/engineer/jisedai/blog/technical_review_ocr_solutions_on_auto_detect

                簡単に利用できる PDF 文字認識 OCR 比較まとめ ~ AI OCR の頭抜けた実力 - GMOインターネットグループ グループ研究開発本部
              • 古文書などの「くずし字」解読が簡単にできる一般向けAI-OCRアプリ、凸版印刷が開発。2023年提供予定

                  古文書などの「くずし字」解読が簡単にできる一般向けAI-OCRアプリ、凸版印刷が開発。2023年提供予定 
                • [スタパ齋藤のApple野郎] iPhoneがOCRスキャナーになる! 2月に爆誕した神アプリで紙の文字をテキスト化!!!

                    [スタパ齋藤のApple野郎] iPhoneがOCRスキャナーになる! 2月に爆誕した神アプリで紙の文字をテキスト化!!!
                  • 数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB

                    科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。 Nougatは、数式や文章が複雑に配置された画像であっても、それをマークアップ言語に高品質で変換する能力を持っています。この技術は、新しい論文だけでなく、電子データが存在しない古い書類などの解析にも非常に有用です。 参照論文情報 タイトル:Nougat: Neural Optical Understanding for Academic Documents 著者:Lukas Blecher, Guillem

                      数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB
                    • 凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCRを日本で初めて開発

                      2022/11/11 凸版印刷、明治期から昭和初期の手書き文字を解読する AI-OCRを日本で初めて開発

                        凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCRを日本で初めて開発
                      • 【ChatGPTとは?】2024年最新!始め方と使い方を徹底解説 - 起業ログ

                        アプリ版ChatGPTの使い方 ダウンロード後、画像左端のようなログイン画面が表示されるので、すでにアカウントを持っている場合は「log in」からログイン、アカウント開設がまだの方は「Sigh in」からアカウント開設を行ってください。 ログインが完了すると、以下の注意事項が表示されます。 「Continue」をタップするとChatGPTを利用し始めることができます。 ChatGPT Plusとは?有料版の料金や限定の新機能について ChatGPT Plusとは一言で言えばChatGPTのより先進的なモデルである「GPT-4」を使えるプランのことです。料金は20ドル/月(約3000円弱)です。 ChatGPT Plus(GPT-4)限定の新機能としては「音声出入力」、「画像やPDF、Wordファイルなどの入力」、WEBブラウジング機能や各種プラグインなどがあります。また、通常のチャットに

                          【ChatGPTとは?】2024年最新!始め方と使い方を徹底解説 - 起業ログ
                        • Windows 10上で無料利用できるAI-OCR 認識精度は95% 認識枚数は制限なし | Ledge.ai

                          サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                            Windows 10上で無料利用できるAI-OCR 認識精度は95% 認識枚数は制限なし | Ledge.ai
                          • GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.

                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                              GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.
                            • 手書き文字を認識できるAIを無償公開 自社サービスでAI OCRが利用可能に | Ledge.ai

                              サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                手書き文字を認識できるAIを無償公開 自社サービスでAI OCRが利用可能に | Ledge.ai
                              • 〜OCR戦記〜適格事業者登録番号との戦い🔥🔥🔥 - LayerX エンジニアブログ

                                この記事はLayerXテックアドカレ2023の5日目の記事です。 昨日はmakogaさんがEngineering Career Ladderを作るときに気をつけたこと 其の一を書いてくれました。 次回はyuya-takeyamaさんがMicrosoft Graph APIについて書いてくれます!乞うご期待! こんにちは、機械学習を通じて誰かをラクにしたい yakipuです。 今回は、10月から始まったインボイス制度に伴う適格請求書発行事業者登録番号(以下「登録番号」と表記します)のOCR読み取りの戦いについて記したいと思います。 インボイス制度は、売手が買手に対して正確な税率や消費税額を示す適格請求書(インボイス)を交付することで、買手が仕入税額控除の適用を受けるために必要な制度です。売手側は登録事業者として登録番号などが記載されたインボイスを交付し、買手側はインボイスを保存する必要があり

                                  〜OCR戦記〜適格事業者登録番号との戦い🔥🔥🔥 - LayerX エンジニアブログ
                                • OCR機能や記号入力補助ツールを強化した「PowerToys 0.66.0」がリリース/自己完結型「.NET 7」アプリとなりランタイム管理も簡素化、リソース消費も削減

                                    OCR機能や記号入力補助ツールを強化した「PowerToys 0.66.0」がリリース/自己完結型「.NET 7」アプリとなりランタイム管理も簡素化、リソース消費も削減
                                  • PDF を Gyazo に展開して Scrapbox の記事にして全文検索する - Diary

                                    PDF を Gyazo に展開して Scrapbox の記事にして全文検索する という試みについてです。 まず PDF を Gyazo に展開して Scrapbox の記事にするということですが、これについてブラウザ上で簡単に動くツールを実装しました。 https://ssig33.github.io/pdftoscrapbox/ おそろしく素朴な見た目ですがとりあえず動きます。Chrome や Edge に Tamper Monkey (試してないけど Firefox と Greasemonkey でも動くんじゃないかな)を入れて、 input に Scrapbox のプロジェクト名を入れて user.js をインストールした上で赤いところに PDFをドラッグ&ドロップすると、 PDF.js で PDF でレンダリングした上で全てのページを Gyazo にアップロードして Scrapbo

                                    • 画像からテキストを抽出 ~「PowerToys」に簡易OCR・物差しなど3つの新ツール/「PowerToys 0.62.0」が公開

                                        画像からテキストを抽出 ~「PowerToys」に簡易OCR・物差しなど3つの新ツール/「PowerToys 0.62.0」が公開
                                      • 画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー

                                        画像に含まれる文字をテキストデータ化する光学文字認識(OCR)は、請求書やレシート、名刺などの印刷物をデジタル化する手法として広く使われています。そんなOCRをディープラーニングフレームワークで実現したのが、オープンソースのOCRシステム「PP-OCRv2」のデモ版となる「PaddleOCR」です。 PaddleOCR - a Hugging Face Space by akhaliq https://huggingface.co/spaces/akhaliq/PaddleOCR GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recog

                                          画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー
                                        • いざ調べ始めると大変、ネットにない古い情報を探すには

                                          米Pew Research Centerの調査によれば、2023年10月の時点で10年前(2013年)のWebページの38%がアクセス不能であるという。 10年前といえばそこそこ昔だと感じるかもしれない。20代の人からすればまだ子供時代だろう。10年前のガジェット、例えばPCやスマホはすでに役に立たなくなっても、新しいものがそれに変われば問題ない。 だが情報はどうだろうか。われわれは常に最新の情報を求めており、うっかり古い情報をつかんでしまうと判断を誤る可能性が高くなる。その一方で過去の情報が無ければ、今の情報の価値が分からなくなるのも事実だ。データとしての年次変化やトレンドの変遷など、過去からのベクトルが追えなくなってしまえば、未来予測もできない。つまり情報は過去からの 連続性が無ければ、未来線が描けないということである。 Webページが失われていくということは、当時のトレンドが分からな

                                            いざ調べ始めると大変、ネットにない古い情報を探すには
                                          • OCRとLLMを活用した情報抽出業務の効率化|Algomatic

                                            はじめに企業の業務において、請求書や領収書、名刺などの紙媒体の情報を電子化し、管理・活用することは非常に重要です。しかし、これらの作業は手作業で行うと多大な時間と労力を要します。また、人的ミスも発生しやすく、業務効率化の大きな障壁となっています。そんな中、近年、OCRの性能向上やLLMの性能向上によって、あらゆる業務の効率化できる可能性が高まっています。この記事では、写真や書類から情報を抽出する取り込み業務について、OCRとLLMを利用したソリューションについて紹介します。 情報抽出などの取り込み業務の課題情報抽出などの取り込み業務では、以下のような課題が存在します。 手作業による時間と労力の浪費 大量の書類を処理する場合、作業コストが膨大に 単純作業の繰り返しによる従業員のモチベーション低下 他の付加価値の高い業務に注力できない 人的ミスの発生 量が多くなるほど、入力ミスや誤読などの人的

                                              OCRとLLMを活用した情報抽出業務の効率化|Algomatic
                                            • OCR前処理としてのOpenCV超解像 - OPTiM TECH BLOG

                                              R&D チームの徳田(@dakuton)です。 最近は画像とテキストの狭間にいます。 今回記事のまとめ 簡単にまとめると以下のとおりです。 いくつかの超解像(高解像度化)モデルがOpenCV extra modules(opencv_contrib)インストール + コード数行記述で導入可能 超解像に限らず、文字が一定サイズ以上になるような前処理 -> OCR解析 を実施すると、OCR精度改善につながることがある 超解像による見た目の滑らかさに比例して、OCR精度改善につながるわけではない 低計算コストな画像拡大から超解像に変更する恩恵は発生しにくい テスト条件を変えた場合、違った結果になる可能性あり(用いるOCRエンジン、画像の劣化条件、OpenCV未提供の後発モデル利用など) 実験内容 利用するOCRエンジンの実行条件は変えずに、前処理部分のみ変更した場合のOCR精度・速度変化を調べま

                                                OCR前処理としてのOpenCV超解像 - OPTiM TECH BLOG
                                              • 明治期の本もテキスト化、国立国会図書館が特注OCRに込めた狙い

                                                「(古い資料の)本文検索ができるようになれば、新たな本の価値を届けられる」。国立国会図書館次世代システム開発研究室の徳原直子室長は力を込める。 国立国会図書館(NDL)は2022年4月25日、新たに開発した「NDLOCR」をオープンソースとして公開した。NDLOCRは、書籍や雑誌などの画像データから本文のテキストデータを作成できるOCR(光学的文字認識)処理プログラム。明治~昭和期の独特なレイアウトにも対応しているのが特徴だ。古い資料でも本文検索ができるようになる。 NDLが蔵書のデジタル化に乗り出したのは2000年代に遡る。資料をスキャンし、主に「JPEG 2000」のフォーマットで保存、提供してきた。NDLが手掛けるオンラインサービス「国立国会図書館デジタルコレクション」から利用可能だ。 デジタル化を進める最大の目的は資料の保存にある。時がたつほど紙は劣化していくからだ。 ただし、ND

                                                  明治期の本もテキスト化、国立国会図書館が特注OCRに込めた狙い
                                                • PDFからテキストを抽出するのはなぜ難しいのか?

                                                  PDFファイルは、どんな環境のPCでもテキストや画像の表示を崩すことなく見られるデータ形式です。しかし、PDFからテキストデータをコピーしようとすると、うまく選択できなかったり、テキストの内容がおかしくなってしまったりすることがあります。なぜPDFファイルからのテキスト抽出が難しいのかを、PDFファイルのテキスト化およびデータベース作成を行う団体、FilingDBが報告しています。 PDF text extraction | FilingDB https://www.filingdb.com/pdf-text-extraction ◆読み取り保護 PDFファイルの中には内容が保護されているものが存在します。テキスト自体は正しく表示されていても、テキストをコピーしようとすると「Copying text was denied (テキストのコピーが拒否されました)」といった内容が表示され、テキス

                                                    PDFからテキストを抽出するのはなぜ難しいのか?
                                                  • OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強化 | AIDB

                                                    関連研究 ChatGPTの”ふるまいの変化”を定量的に分析した結果 OpenAI、大規模言語モデルの数学能力を大きく向上させることに成功 GPT-4を使用した知的労働者のパフォーマンスは軒並み向上し、もとの成績が良くないほど顕著。※注意点あり 従来の課題 GPT-4Vは、従来のGPT-4が抱えていたいくつかの課題を解決する形で登場しました。 テキスト中心の処理能力 従来のGPT-4は、テキストデータの処理能力に特化しており、テキストベースの質問応答、文章生成、自然言語理解など、多くの用途で非常に有用でした。 しかし、裏を返せば画像や音声など他のメディア形式に対する対応が不足していました。テキストと画像が組み合わさったマルチモーダルなデータに対する処理能力が限定的でした。 画像入力とプライバシー GPT-4の画像データに対する安全な処理能力には限界がありました。例えばプライバシー保護の観点が

                                                      OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強化 | AIDB
                                                    • 無償デスクトップ自動化ツール「Power Automate Desktop」でOCR処理を自動化する

                                                      はじめに 日々の業務作業で、画面や画像を見てその内容によって、その後の作業の流れや結果を変更する場面があります。そういった業務作業をPower Automate for desktopで自動化する際に、OCRのアクションを利用できます。 今回は、文字列が含まれた画像ファイルが複数入ったフォルダーを用意して、その中の各画像の文字列を抽出するサンプルフローを作成します。 [注意] アクションには、MicrosoftコグニティブのOCRの機能もありますが今回は使用しません。Azureアカウントなどは不要です。 「ファイル選択ダイアログ」アクションの後に「OCRを使ってテキストを抽出」アクションを使用するとデッドロックしてフリーズしてしまう問題があるようですので、ご注意ください。 フォルダー/素材の準備 まずはOCR読み込みのもととなる画像ファイルと、サンプル実行に必要なフォルダーを準備します。

                                                        無償デスクトップ自動化ツール「Power Automate Desktop」でOCR処理を自動化する
                                                      • AIによる「超」軽量なOCR(文字認識)システムが登場【GitHub】 | AIDB

                                                        光学式文字認識(OCR)システムは、文書の電子化・工場での文字自動検出・オンライン教育・地図作成など幅広く使用されています。 中国の巨大テック企業BaiduのYuning Duらは今回新たに、超軽量のOCRシステムである「PP-OCR」を提案しています。 当サイトの利用にはAIDBのアカウントが必要です。 また記事の購読には、アカウント作成後の決済が必要です。 ログイン アカウント作成 ※ログイン/初回登録後、下記ボタンを押してください。 AIDBとは プレミアム会員(記事の購読)について

                                                          AIによる「超」軽量なOCR(文字認識)システムが登場【GitHub】 | AIDB
                                                        • Googleレンズ、紙のテキストをパソコンにコピペ可能に |男子ハック

                                                          Googleは5月7日、「Google レンズ」に紙のテキストを撮影することで、簡単にパソコンへコピーする新機能を追加したと発表しました。新たに撮影したテキストの読み上げ機能も追加。Androidは「Googleレンズ」アプリ、iPhoneは「Googleアプリ」から利用できます。 Googleレンズ新機能は「スマホで撮影したテキストをPCにコピー」「Googleレンズ」で撮影した紙のテキストをPCにコピーGoogleレンズに、「紙のテキストをパソコンにコピーする」機能が追加されました。 これまでもGoogleレンズでは、スマートフォンで撮影した手書きのメモや書類のテキストを読み取ることは出来ましたが、アップデートにより、読み取ったテキストをパソコンに共有、パソコンでコピー&ペーストできるようになりました。 パソコンにコピーするには、パソコン側でChrome(最新版)を使用し、スマートフォ

                                                            Googleレンズ、紙のテキストをパソコンにコピペ可能に |男子ハック
                                                          • PDFから超簡単文字起こし!Googleドライブが優秀すぎた | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

                                                            こんにちは! オフショア開発チームで通訳/翻訳をしているゆまです。 今回は長年の悩みだった「PDFの文字起こし」について、感動する出来事があったのでシェアさせてください。 ※手っ取り早く方法だけ知りたい方は、「Googleドライブで文字起こしする方法」からご覧ください! ある日の出来事 翻訳依頼が入りました。 しかし、原本がPDF…… しかもWordなどから生成されたものではなく、スキャンされた画像…… わかります……最終的に保管したい文書ってサイン済、捺印済の書類ですよね……。 これ、翻訳担当あるあるじゃないですか? 翻訳に限らず、コーポレートあるあるな気がするのですが、皆さんどうですか? けっこう前に締結した契約書をベースにしたい、でもWordファイルどっか行っちゃった、とか……。 原文、どうやって文字起こしする?手打ちする? さて、こういった状況の場合、どうやって文字起こししますか?

                                                              PDFから超簡単文字起こし!Googleドライブが優秀すぎた | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
                                                            • Google Keep の OCR機能が超便利*画像の文字を一瞬でテキストに変えてくれる機能 - ひとりごとブログ

                                                              こんにちは、ふなさんです。 普段、勉強やブログの内容をまとめるためにGoogle keepを使っているのですが、OCR機能があることを今更ですが知りました。 OCR機能とは、簡単に言うと画像の中の文字データを読み取ってテキスト化するものです。 私は勉強するときに手書きメモを取ることがありますが、後からまとめるときに手で入力するのは時間がかかります。 OCR機能があると、一瞬で文字データに変えてくれるので、手入力する手間が省けてとても便利です✨ chrome.google.com ①Google Keep でOCR機能を使う手順 Google Keep でOCR機能を使うための手順は以下の通りです。 PC版 ①Google Keep のメモに画像を追加する ②メモの「その他のアクション」をクリック ③「画像のテキストを抽出」をクリック スマホ版 ①Google Keep のメモに画像を追加す

                                                                Google Keep の OCR機能が超便利*画像の文字を一瞬でテキストに変えてくれる機能 - ひとりごとブログ
                                                              • Python&Plotlyを使って、OCR結果を画像上でインタラクティブに可視化する

                                                                概要 OCRを使った文字読み取りの開発をしていると、読み取られたテキストと画像と見比べて結果の確認をすることがよくあります。読み取られたこの文字は画像のどこから出てきたのかとか、単語の区切りが不自然なときになぜそうなったのかとかといった確認の際には、テキストとその座標から画像中の該当箇所を見つける必要があり、人間が目視で行うにはなかなか大変な作業です。物体認識などのタスクでは、画像上に四角形のバウンディングボックスを物体名のラベルとともに描写して可視化していますが、OCRの読み取りの場合は文字が画像上で密に配置されていたりと、画像上に直接描写するには情報量が過多になってしまいます。なるべくインタラクティブに操作出来る形で情報を表示し、必要な部分だけを確認できるようにしたい場合が多いです。 この記事では、OCR読み取りの結果を画像上に描写して、インタラクティブに結果を確認する方法を紹介します

                                                                  Python&Plotlyを使って、OCR結果を画像上でインタラクティブに可視化する
                                                                • メモの作成やタスク管理、共同作業を効率化!Evernoteから乗り換えるべきメモアプリ8選 | ライフハッカー・ジャパン

                                                                  著者Khamosh Pathak - Lifehacker US [原文]翻訳白井樹(OCiETe) 2023.12.15 lastupdate 2010年代、生産性向上を追求する多くの人たちにとって「Evernote」はの必須のメモアプリでした。 メモや画像、さらにはToDoを使ったノートブックの作成が高速で可能に。また、誰とでも簡単に共有して共同作業ができるようになり、ワンクリックでウェブから何でもインポートできる便利なツールも備えていました。しかも、これがほぼ無料だったのです。 しかし、ここ5年間で状況は悪い方向に変化し続けました。Evernoteは、「それほど高くはない」有料プランを広めようと、無料プランの制限をはじめたのです。 そしてその後、価格は上がり続けました。2023年現在、個人用の基本プランはなんと月額14.99ドル、年間129.99ドルで、プロフェッショナルのプランは月

                                                                    メモの作成やタスク管理、共同作業を効率化!Evernoteから乗り換えるべきメモアプリ8選 | ライフハッカー・ジャパン
                                                                  • AIの民主化が進む時代におけるバクラクのAI-OCR機能の開発戦略 #LayerXテックアドカレ - LayerX エンジニアブログ

                                                                    LayerX バクラク事業部 機械学習チームの機械学習エンジニア兼マネージャーの松村(@yu-ya4)です。半年間に結婚祝いでいただいたたくさんのお酒が順調に減ってきているのですが、サントリーウイスキー角瓶 4Lペットだけはなくなる気配がありません。 この記事はLayerXテックアドカレ2023の16日目の記事のはずです。 前回はosukeさんの『Azure AI SearchのSemantic Ranker』という記事でした。 次回はminako-phさんによるタメになる記事、『Notionでスプリントのあれこれをダッシュボードで可視化する 』が公開予定ですされました。 昨今のAIの進化には目を見張るものがあります。先日のOpenAI DevDayやMicrosoft Igniteでも様々な衝撃的な発表がなされました。今週は違う意味で衝撃的なニュースが多かったですが。 そのような時代です

                                                                      AIの民主化が進む時代におけるバクラクのAI-OCR機能の開発戦略 #LayerXテックアドカレ - LayerX エンジニアブログ
                                                                    • 「iPhoneのメモ」はもはや多機能なノートアプリだ

                                                                      コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕

                                                                        「iPhoneのメモ」はもはや多機能なノートアプリだ
                                                                      • スマホの写真に映ったテキストをPCにコピーできたら便利! 実はWindows 11標準で可能/「スマートフォン連携」の簡易OCRを試す【やじうまの杜】

                                                                          スマホの写真に映ったテキストをPCにコピーできたら便利! 実はWindows 11標準で可能/「スマートフォン連携」の簡易OCRを試す【やじうまの杜】
                                                                        • https://twitter.com/HeathRossie/status/1457664989091663879

                                                                            https://twitter.com/HeathRossie/status/1457664989091663879
                                                                          • ヌルポインターストライク

                                                                            当HPは無料で使える翻訳支援ツール「PCOT」を公開しています。 「なにこれ便利!」と思った方は是非Twitterをフォローしてください! 作者のTwitter:ぬるっぽ 翻訳支援ツールです。プロセスが接続できるものであればなんでも翻訳可能です。 フルスクリーン、または一部のプロセスには非対応です。 リアルタイム翻訳には対応していません。ご了承頂ける方のみDLしてください。 環境によってはウイルスと誤認識される可能性がありますが、それらの類は一切組み込んでいません。

                                                                            • 無料&ブラウザ上でPDF・JPEG・PNG・GIFファイルからOCRによるテキスト抽出ができる「OCR PDFs and images directly in your browser」

                                                                              PNG・JPEG・GIFといった画像ファイルやPDFファイルから、TesseractによるOCR(光学文字認識)でテキストを抽出できる「OCR PDFs and images directly in your browser」をエンジニアのサイモン・ウィルソン氏が公開しました。OCR PDFs and images directly in your browserはすべての処理をブラウザ上で実行するため、ファイルをどこかのサーバーにアップロードすることがないというのが大きな特徴です。 OCR PDFs and images directly in your browser https://tools.simonwillison.net/ocr Running OCR against PDFs and images directly in your browser https://simon

                                                                                無料&ブラウザ上でPDF・JPEG・PNG・GIFファイルからOCRによるテキスト抽出ができる「OCR PDFs and images directly in your browser」
                                                                              • Windows版「Excel」に画像認識機能、紙の書類からテーブルデータの取り込みが簡単に/ただし、日本語のサポートは……

                                                                                  Windows版「Excel」に画像認識機能、紙の書類からテーブルデータの取り込みが簡単に/ただし、日本語のサポートは……
                                                                                • [簡単にできる!] Power Automate for desktop(RPA)で PDF請求書をまとめてエクセルに転記する。 - Qiita

                                                                                  [簡単にできる!] Power Automate for desktop(RPA)で PDF請求書をまとめてエクセルに転記する。PDFOCRPowerPlatformPowerAutomateDesktop 今回は、オフィスの業務課題を想定して、Power Automate for desktop(RPA)で、月末営業から届く大量の請求書(PDF)の内容をOCRを使って文字認識させて、エクセルに転機して売上一覧を作成することを自動化します。 この自動化は、PDFから取得する文字の位置が違うとデータが取れませんので、レイアウトが基本同じであることが条件です。よくあるのは、合計金額を表示する位置が、見積もりの項目数により位置が変わる場合などは取得が難しいです。 Power Automate for desktopはWindows10や11に無償で提供されていますが、時間で定期的に起動したり、何

                                                                                    [簡単にできる!] Power Automate for desktop(RPA)で PDF請求書をまとめてエクセルに転記する。 - Qiita