タグ

2017年11月24日のブックマーク (2件)

  • Mac - Automatorを使って PDFファイルからテキストを抽出 - 開発メモ - Webkaru

    Mac の Automator を使って、PDFファイルからテキストを抽出する方法を紹介します。 PDFファイルからテキストを抽出すると、スクリプトを使ってテキストを編集することができるようになります。なかなか便利な機能なので、使い方を覚えておきましょう。 「新規書類」をクリックします。 種類の種類の選択です。「ワークフロー」が選択されていることを確認し、「選択」をクリックします。 テキストを抽出したい PDFファイルをドラッグしましょう。 PDFファイルをドラッグしたら「検索フォーム」に 「pdf」と入力し、「PDF テキストを取り出す」をダブルクリックします。 すると、右カラムに「PDFテキストを取り出す」という項目が表示されます。 ここでは、出力方法・保存先・ファイル名などを設定することができます。 右上の「実行」をクリックすると このようにテキストファイルが作成されます。 テキスト

    Mac - Automatorを使って PDFファイルからテキストを抽出 - 開発メモ - Webkaru
    hidehara
    hidehara 2017/11/24
    Automator は、ふと必要な時に役立ってくれる。 うれしいわ
  • 【追記あり】SphinxのblockdiagでOSごとにフォント設定を変える方法

    Sphinxで簡単なフローとかを書く時にblockdiagを使うことがある。ただ、blockdiagは、フォント設定をしておかないとSphinxのビルド時にエラーになってしまう。 しかも、フォントの設定はMacLinuxWindowsでパスも使うフォントも違う。そこで、Sphinxのconf.pyを使って、OSごとにフォント設定を変える方法を紹介。 追記 この記事を公開後、Twitterで作者さんからもっと便利な対処方法を教えていただきました。そちらの方が便利なので、以下の方法をお勧めします。@tk0miyaさんありがとうございました! blockdiag_fontpath = [ 'C:\WINDOWS\Fonts\MEIRYO.TTC', '/Users/mas/Library/Fonts/meiryo.ttc', '/etc/alternatives/fonts-japanese

    hidehara
    hidehara 2017/11/24
    これとアンチエイリアス設定で、とてもきれいな図が Linux + blockdiag on Sphinx 環境でも出力できた。うれしい。