タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

pdftotextに関するfreedomcatのブックマーク (2)

  • PDFを検索対象に

    PDFファイルをNamazuの検索対象に加えるにはxpdfに含まれるpdftotextというプログラムを使用する必要があります。pdftotextはPDFに含まれているtextを抽出するツールです。これまでは日語の処理に不十分な面があった感じでしたので、個人的には別のツールを使ってPDFのインデックス化をしていました。しかし、2002年2月1日にリリースされたxpdf-1.00から日語や中国語、韓国語などのLanguage Support Packageが提供されるようになり、機能的にも十分なツールになった感があります。 詳細はhttp://www.foolabs.com/xpdf/(英文)を参照してください。 Namazu2.0.12のリリースに伴い、pdfファイルの文書フィルタであるpdf.plがxpdf1.00以降のpdftotextのオプション変更に対応しました。xpdfのバー

  • [debian-users:32093] Re: xpdf で日本語が表示できない (woody)

    From: knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) Subject: [debian-users:32093] Re: xpdf で日語が表示できない (woody) Date: Mon, 18 Mar 2002 18:11:26 +0900 X-authentication-warning: ns1.eal.or.jp: Host puti.eal.or.jp [211.7.33.2] claimed to be puti X-ml-info: If you have a question, send e-mail with the body "help" (without quotes) to the address debian-users-ctl@debian.or.jp; help=<mailto:debian-users-ctl@debia

    freedomcat
    freedomcat 2010/02/26
    xpdf-japanese を入れて下さい。xpdf 1.00 になって、この辺りが分離され たようです。
  • 1