dd, awk, less, gzip などの伝統的な UNIX ツールのみを使って PDF からテキストを手動で抽出する方法を紹介します。(約42分) 参考資料: naacl06-shinyama.pdf (実際に使ったPDF) jo.pdf (実際に使ったPDF) Adobe CMap Resources (Adobe-Japan1 CID と Unicode対応表) PDFMiner (PDFテキスト抽出ツール) Yusuke Shinyama
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く