R&D チームの徳田(@dakuton)です。 前回、2値化画像処理の論文(+実装)について紹介しましたが、今回はこういった2値化の応用例としてExcalibur(PDFからテーブルデータを抽出するためのWeb UIベースのツール)を紹介します。 本記事はOPTiM TECH BLOG Advent Calendar 2020 12/7 の記事としてお送りします。 前回記事はこちら。 tech-blog.optim.co.jp 動かしてみる インストール # https://camelot-py.readthedocs.io/en/master/user/install-deps.html#macos] brew install ghostscript tcl-tk pip install excalibur-py excalibur initdb 実行結果 今回もこちら(Rustの全マク