overlastのブックマーク - はてなブックマーク

overlast id:overlast

ブックマーク / tabesugi.net (1)

dd, awk, less を使って PDF からテキスト抽出
dd, awk, less, gzip などの伝統的な UNIX ツールのみを使って PDF からテキストを手動で抽出する方法を紹介します。(約42分) 参考資料: naacl06-shinyama.pdf (実際に使ったPDF) jo.pdf (実際に使ったPDF) Adobe CMap Resources (Adobe-Japan1 CID と Unicode対応表) PDFMiner (PDFテキスト抽出ツール) Yusuke Shinyama
overlast 2010/02/21
pdf
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx