アドビは8月3日、公式ブログにて「PDFの可能性を広げるAdobe Document Serviceの新しいAPI」と題した記事を公開した。新たなAPIである「PDF Extract API」を使うことでPDFからの高度なデータ抽出が可能となる。 Adobe PDF Extract APIは、アドビが昨年発表した「Adobe Sensei」をベースとしたPDF解析API。PDFにどのようなデータが含まれているかを判別することはテキストや段組み、表組みや画像といった要素を解釈してドキュメントの構造を理解することが必要となるが、これをAIと機械学習プラットフォームであるAdobe Senseiを用いるもの。 PDFに含まれる要素を自動的に抽出できることにより、機械学習モデルへの利用、分析やインデックス作成、抽出データの保存、RPA(ロボティック・プロセス・オートメーション)やNLP(自然言語処