タグ

OCRに関するcpwのブックマーク (6)

  • AIの民主化が進む時代におけるバクラクのAI-OCR機能の開発戦略 #LayerXテックアドカレ - LayerX エンジニアブログ

    LayerX バクラク事業部 機械学習チームの機械学習エンジニア兼マネージャーの松村(@yu-ya4)です。半年間に結婚祝いでいただいたたくさんのお酒が順調に減ってきているのですが、サントリーウイスキー角瓶 4Lペットだけはなくなる気配がありません。 この記事はLayerXテックアドカレ2023の16日目の記事のはずです。 前回はosukeさんの『Azure AI SearchのSemantic Ranker』という記事でした。 次回はminako-phさんによるタメになる記事、『Notionでスプリントのあれこれをダッシュボードで可視化する 』が公開予定ですされました。 昨今のAIの進化には目を見張るものがあります。先日のOpenAI DevDayやMicrosoft Igniteでも様々な衝撃的な発表がなされました。今週は違う意味で衝撃的なニュースが多かったですが。 そのような時代です

    AIの民主化が進む時代におけるバクラクのAI-OCR機能の開発戦略 #LayerXテックアドカレ - LayerX エンジニアブログ
    cpw
    cpw 2023/11/27
    OCRとその後処理の二つに分けて考える必要があるのでは?OCRの機能はバクラクが外部サービスを使う、その後の処理はバクラク内製でいい感じにするという方が良さそうだと感じた。
  • macOS のデフォルト状態でコマンドラインからOCR処理を行う - TeX Alchemist Online

    macOS 12 Monterey では,OSビルトインでのOCR機能が搭載されました。Preview.app で,画像やスキャンPDF(中身がスキャン画像のPDF)に対して,ただマウスでドラッグするだけで,中身の文字を認識して選択し,コピーできるようになっています。さらに,macOS 13 Ventura では,それが日語にも対応しました。 たとえば,(今や入手困難となってしまった)The TeXbook のアスキーによる日語版をスキャンしたものを Preview.app で開くと,何もしなくても,文字選択できます。 これをコピーして他のエディタにペーストすると, TEXの名称で気をつけなければならないことがほかにもある。Eの文字が不揃いになっていることだ。Eの文字を少し下げてあるのは、TeXが組版のためのシステムであることを印象づけるためであり、またほかのシステムの名称と区別するた

    macOS のデフォルト状態でコマンドラインからOCR処理を行う - TeX Alchemist Online
    cpw
    cpw 2023/06/29
    これ欲しくて諦めてたやつ。助かります!
  • WWDC22:iOS 16/macOS VenturaのPDFKit、テキスト認識表示機能をサポート | NEWS | Mac OTAKARA

    サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部がサイトに還元されることがあります。 Appleが、WWDC22において、PDFに関する「What's new in PDFKit」を公開しています。 PDFKitは、アプリケーションがPDFファイルを表示、編集、書き込みできるようにする、フル機能のフレームワークです。 PDFKitはLive Textをサポートするようになりました。写真とは異なり、テキストはタップしてコピーすることが多いのですが、そのテキストは少量です。 写真と違って、PDFでは、テキストが表示されれば、それは一般的にテキストであり、人々は特別なことをしなくても、そのように動作することを期待しています。 Live Textを使えば、このようなPDF文書内のテキストを選択し、検索することができます。 これはビットマップをスキャン

    WWDC22:iOS 16/macOS VenturaのPDFKit、テキスト認識表示機能をサポート | NEWS | Mac OTAKARA
    cpw
    cpw 2022/12/11
  • GitHub - dinosauria123/gcv2hocr: gcv2hocr converts from Google Cloud Vision OCR output to hocr to make a searchable pdf.

    cpw
    cpw 2020/09/22
    PDFを検索可能にしたいときに使う
  • OCR技術解説1:はじめに

    OCR 技術解説 文字の読み取り・認識について はじめに PCCPU性能の向上に伴い、PC上で文字を認識するOCR(Optical Character Recognition/Reader)ソフトが商品化され、多くのユーザーに活用されています。OCRソフトは、ワープロやデータベース、表計算ソフトなどと比較すると、その内部処理(文字をどのように認識しているのか?)が一般の人には想像しにくいところです。 これまでPCのソフトとして発展してきた分野としては、決った手法の計算処理を、速いスピードで実行するという、人間にとってきわめて不得意な部分でした。 人間にとって得意な分野であるがコンピュータには弱い分野であるパターン認識をソフトウェアで実現したのがOCRソフトです。 ここでは、文字認識ソフトウェアであるOCRソフトに焦点をあて、あまり知られていない文字の認識方法や技術水準について、当社の方式

    OCR技術解説1:はじめに
    cpw
    cpw 2017/02/23
    OCRの仕組み
  • まちみのな::C#で文字認識を行う

    Microsoft Office をインストールすると、実は OCR ソフトがついてきます。C# からの利用も簡単です。下記のコードを、Visual C# Express 2005 または 2008 で作成し、参照設定に、 Microsoft Office Document Imaging 11.0 Type Library (MDIVWCTL.DLL) を追加してビルドしてください。 [:ボックス1:] ソースコードのダウンロード (Visual C# Express 2008 用) v1.0 (2008/07/21) using System; using System.Text; /// /// OCR witMicrosoftR Office By Martin Welker (CodeProject) /// に基づく Office 2003 に依存したOCR処理。 /// 

    cpw
    cpw 2010/07/07
  • 1