タグ

doc2txtとpdf2txtに関するFeZnのブックマーク (2)

  • フォルダ内のWord文書を一括でTXTファイルにするバッチファイルの控え。 | FeZn/Bookmark

    xdoc2txt http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html を使用して、フォルダ内すべての「PDF,WORD,EXCEL,一太郎などの各種バイナリ文書からテキストを抽出」するバッチファイル。今回はWord専用。 だいたい今の僕の仕事場だと、Word文書をtxtに変換することが多かったりするゆえですが、多いといってもさほどのことではなく。 FeZn/Bookmark : ネットワークプリンタにPINGを打つバッチファイルの控え http://fezn.exblog.jp/5772255/ と、同系統。すなわちCUI(CLI)操作代替のバッチファイル。 結局自分が使う分にはコマンドプロンプトで直接操作しているので、元々は「CUI恐怖症の方ため」&「なんとなく、書いたら楽しそうだから」という理由で作った次第。 しかし折角作ったのに、自分自身が既

    フォルダ内のWord文書を一括でTXTファイルにするバッチファイルの控え。 | FeZn/Bookmark
  • xdoc2txt

    xdoc2txt.exe [-s|-e|-j][-c][-f][-p][-n][-r=(0|1|2)] <filename...> -h ヘルプの表示 -s 出力のエンコードはShiftJIS(デフォルト) -j 出力のエンコードはJIS -s 出力のエンコードはEUC -c PDFキャッシュ on(デフォルトはoff) -f 変換結果をファイルに出力。デフォルトでは標準出力に出力 -p OLE2複合文書の場合、文書プロパティを表示(Office、一太郎で有効) -n PDF文書のアクセス権限の設定を無視(cryptlib.dllが必要) -r= HTML文書のルビの変換 -r=0 ルビ削除 -r=1 () -r=2 《》青空文庫形式 -o= その他のオプション -o=0 PDFで -- ? -- の形式のページ番号を表示しない -o=1 PDFで改行を削除(

    FeZn
    FeZn 2006/01/07
     ★ワープロ独自形式などの文書をtxtに変換。便利な上に高速快適。(要CUI技能)
  • 1