エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
tabula-java - PDFの表データを抽出するコマンド
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
tabula-java - PDFの表データを抽出するコマンド
PDFは改変されづらいフォーマットですが、書かれている情報を抜き出したいと思うことは良くあります。そ... PDFは改変されづらいフォーマットですが、書かれている情報を抜き出したいと思うことは良くあります。その多くが帳票や一覧データからのデータ抜き出しです。便利なフォーマットの反面、目的のデータがシステム的に処理しづらいのが難点です。 そこで使ってみたいのがtabula-javaです。コマンド一つで表形式のデータを抜き出せます。 tabula-javaの使い方 AWSの請求書からデータを抜き出してみます。形式はJSONとしてみました。 $ java -jar tabula-1.0.4-jar-with-dependencies.jar -f JSON pdf/hoge.pdf [{"extraction_method":"lattice","top":340.04214,"left":35.97931,"width":540.0157470703125,"height":101.99786376