Google Cloud Vision API を使って、PDFから文字を抽出し、簡易的なEPUB を作成してみました 西田@大阪@MAD事業部です。 本エントリは クラスメソッド Google Cloud Advent Calendar 2021 の 15日目 の記事です。 今回は Google Cloud Vision API を使って、PDFから文字を抽出し、簡易的なEPUB を作成してみました Cloud Vision APIとは Cloud Vision API は機械学習の知識がなくても、簡単に画像の解析が可能でサービスです。画像、PDF/TIFF からテキストを抽出したり(OCR)、ランドマーク検出、顔検出などができます。 参考: 機能リスト | Cloud Vision API | Google Cloud 構成 Input 用の Cloud Storage に PDFファ