Amazon Textract は、スキャンしたドキュメントからテキスト、手書き文字、レイアウト要素、データを自動的に抽出する機械学習 (ML) サービスです。単純な光学文字認識 (OCR) のレベルにとどまらず、ドキュメントから特定のデータを識別、理解、抽出します。今日、多くの企業は、PDF、画像、表、フォームなどのスキャンされたドキュメントから、または手動設定 (多くの場合、フォームが変更されたときに更新する必要があります) を必要とする単純な OCR ソフトウェアを介して、データを手動で抽出しています。これらのコストがかかる手動のプロセスをなくすために、Textract では機械学習を利用しています。手作業なしで、あらゆる種類のドキュメントを読み取って処理し、テキスト、手書きの文字、表などのデータを正確に抽出できます。ローン処理を自動化する場合でも、請求書や領収書から情報を抽出する場
![Amazon Textract | Extract Text & Data | AWS](https://cdn-ak-scissors.b.st-hatena.com/image/square/c4f530e16dfb308a48108c71972db725de90d0d5/height=288;version=1;width=512/https%3A%2F%2Fa0.awsstatic.com%2Flibra-css%2Fimages%2Flogos%2Faws_logo_smile_1200x630.png)