便利なRパッケージを見つけたのでメモがてら紹介しておきます。以前、Rを使ってPDF上のテキストを取得するパッケージとして{tm}パッケージを紹介しましたが、同様の機能をもった{pdftools}は以下の特徴があります。 PDFがもつ各種の情報やテキストを取得できる 日本語も問題なし PDFがロックされている場合、パスワードで開ける PDFを画像として出力できる 開発者はrOpenSciの一員でもあるJeroen Oomsです。 github.com uribo.hatenablog.com {tm}パッケージでは日本語が含まれるPDFを扱う際にはちょっとした工夫が必要でしたが、{pdftools}では日本語の出力も問題なく行うことができてちょっと感動しました。機能としてPDFの情報を得る、ということとPDFを画像として出力する、というものがあります。 🔰 使用例 CRANに登録されている
![⭐️PDFの情報・文章をRでごっそり取得する - cucumber flesh](https://cdn-ak-scissors.b.st-hatena.com/image/square/ad08b111d8ce6248b1e491a703c2a8f6d8ce0647/height=288;version=1;width=512/http%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fu%2Fu_ribo%2F20160227%2F20160227194202.png)