タグ

Toolとpdfに関するtetzlのブックマーク (2)

  • Windows10の無償デスクトップ自動化ツール「Power Automate Desktop」でPDFからのデータ抽出を自動化する

    対象読者 ExcelPowerPointなど、一般的なツールの操作を理解している人 RPAツールを用いて業務を自動化したい人 PDFアクション PDF(Portable Document Format)とは、Adobe社が開発したページ記述言語PostScriptをベースにしたドキュメント形式のこと。環境やプリンターによらずに保存・転送・閲覧・印刷が可能であり、電子ドキュメントにおける事実上の標準のファイル形式として広く使用されています。ファイルの中に、テキストデータと描画命令、画像などのコードが圧縮されて格納されています。 Power Automate for Desktopでも、これらのファイルを扱うアクションが用意されています。 PDFからテキストを抽出 PDFから画像を抽出 PDFからテーブルを抽出 新しい PDFファイルへのPDFファイルページの抽出 PDFファイルを統合 稿

    Windows10の無償デスクトップ自動化ツール「Power Automate Desktop」でPDFからのデータ抽出を自動化する
  • PDFチェックツール (pdf-checker)

    このツールは複数のPDFファイルの情報を一括してチェックするためのツールです。 もともと、図書館等における大量の紙資料をスキャンする必要がある場合において、納品されたPDFファイルやOCRソフトウェアが出力したPDFファイルを、(ある程度まで)自動的にチェックしたいというニーズに対応するツールとして試作したものです。 現在、以下の項目をチェックして出力する機能を有しています: PDFのバージョン PDFページ数 PDFにかけられたコピー制限等のセキュリティ設定 (各ページについて以下の各項目:) ページに埋め込まれた画像の形式 ページに埋め込まれた画像の解像度(DPI) ページ内に埋め込まれたテキストの文字数 更新履歴 2010-09-14 バージョン 20110914 を公開。 出力形式を大幅に変更しました。 PDFファイルにセキュリティ設定がかかっている場合、その情報を出力するようにし

    tetzl
    tetzl 2011/02/15
  • 1