ブックマーク / qiita.com/windows222 (1)

  • Amazon Textractを試してみた - Qiita

    これまで承認制だったAmazon textractがついに一般公開となりました。 現段階では日リージョンには来ておらず、また、日語にも未対応ですが、今後各種言語に対応していくとのこと。 Textractとは、伝票などの画像ファイルを渡すと、そこに書かれているテキストを読み取った結果を返してくれるサービスです。 通常のOCRのように、読み取った文字列をただ返してくれるだけでなく、顧客名、住所、合計金額などの意味までを読み取ってくれるのが特徴です。 この処理には、機械学習技術を使っているとのこと。 今回はブラウザ上からデータを渡して結果を参照しましたが、REST形式でデータを渡して結果をCSVで受け取ることなどもできます。 どの程度の精度を誇るのか以前から気になっていたので、実際に試してみました。 実験1 帳票データ まず最初に渡したのが以下のデータ。 これはインターネット上から探してき

    Amazon Textractを試してみた - Qiita
    a-know
    a-know 2019/06/03
  • 1