タグ

ocrに関するlilpacyのブックマーク (2)

  • AI-OCRを支える非同期処理アーキテクチャ - LayerX エンジニアブログ

    こんにちは!LayerXエンジニアの高際 @shun_tak です! この記事では、LayerX インボイスの請求書AI-OCRを支える非同期処理の仕組みについて解説したいと思います。 いきなりサマリーですが、今回お伝えしたいのは以下の2点です。 請求書は突然大量にアップロードされるので(大歓迎です!)、Amazon SQSとGomachinery を活用して非同期処理しているよ! AI-OCRの処理は重たいけど、AWS Lambdaを活用してシステム全体の負荷を分散し、スケーラビリティと可用性を確保し、コストも抑えることができたよ! では早速ですが、前回のブログ LayerX インボイスにおける請求書AI-OCRの概要 の復習です。LayerX インボイスの請求書AI-OCRは、以下の図のように複数の処理によって構成されています。 図にするとあっさりしてますが、前処理も後処理も複数の

    AI-OCRを支える非同期処理アーキテクチャ - LayerX エンジニアブログ
  • gDriveOCR - Google Driveを使ったOCR

    MOONGIFTはオープンソース・ソフトウェアを紹介するブログです。2021年07月16日で更新停止しました OCRは大抵スキャナなどに備わっています。オープンソースのOCRもあることはあるのですが、品質はあまり高くありません。画像の中から効率的に情報を取り出す方法は手間がかかるイメージがあります。紙文書からテキストデータを取り出すのに苦労した人も多いでしょう。 今回紹介するgDriveOCRはスマートな解決手法になるそうです。OCRとしてGoogle Driveを使います。 gDriveOCRの使い方 たとえば次のようなコマンドを打ちます。日語も指定可能です。 gdriveocr moongift.png 実行後、Wordファイルがダウンロードされます。元の画像と、そのOCR結果が表示されます。 gDriveOCRはGoogle DriveのOCR機能を使って、コマンドでファイルをアッ

    gDriveOCR - Google Driveを使ったOCR
  • 1