PDFは文書を扱う際によく使われるファイル形式ですが、現実には印刷された文書をスキャンした「画像」としてPDFを扱うことも少なくありません。FAX、郵送、またはメールに添付されたPDFが何故か画像だったり……。こうしたPDFは「画像」として扱われるため文字や数字をコピーすることはできません。便宜上ここではスキャンPDFと呼びます。 スキャンPDFの読み込みに便利なGoogle Pinpointというツールがあります。一言で表現すれば大量のドキュメントを探索・分析するためのツールです。PDF、Word文書、画像、メールアーカイブなど、様々な形式のファイルをひとつのフォルダ(コレクションと呼ばれます)にアップロードすることで、横断的に検索したり登場する単語を集計することが可能になります。Google Journalist Studioと呼ばれる、主に報道分野の記者を対象としたツール群のひとつで