タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

ocrに関するhokupodのブックマーク (1)

  • Amazon Textractを試してみた - Qiita

    これまで承認制だったAmazon textractがついに一般公開となりました。 現段階では日リージョンには来ておらず、また、日語にも未対応ですが、今後各種言語に対応していくとのこと。 Textractとは、伝票などの画像ファイルを渡すと、そこに書かれているテキストを読み取った結果を返してくれるサービスです。 通常のOCRのように、読み取った文字列をただ返してくれるだけでなく、顧客名、住所、合計金額などの意味までを読み取ってくれるのが特徴です。 この処理には、機械学習技術を使っているとのこと。 今回はブラウザ上からデータを渡して結果を参照しましたが、REST形式でデータを渡して結果をCSVで受け取ることなどもできます。 どの程度の精度を誇るのか以前から気になっていたので、実際に試してみました。 実験1 帳票データ まず最初に渡したのが以下のデータ。 これはインターネット上から探してき

    Amazon Textractを試してみた - Qiita
    hokupod
    hokupod 2019/06/02
    試したPDFって、テキスト埋め込みじゃないやつかしら。
  • 1