1. 日本語帳票を識別するため何が必要? 第一回と第二回では、英語の帳票を利用してデータの抽出を実施しました。第三回では、日本語の帳票(請求書と源泉徴収票)からもデータを抽出していきましょう。サンプルデータはこちらより取得してください。 日本語の帳票を分類・抽出するために、日本語に特化したOCRエンジンとエンドポイントが必要になります。例えば、分類器の設定が以下のように異なっています。 今回の解説は、UiPath Document Understanding 第1回 基礎編 複数種類のドキュメントからデータ抽出しよう をベースにしています。こちらでは、第一回との差分の部分だけを解説します。 第一回をまだ読んでいない方は、そちらを先にチェックしてください。 それでは、第一回のワークフローをDU_Basic_Sample_第一回.zipからダウンロードして、日本語帳票の分類と抽出ができるように