タグ

pdfとテキストに関するtsuyossiiのブックマーク (2)

  • レッツ! Windows 7 - 検索編(1)

    64ビット版Windows 7でPDFのインデックス化を可能にする 先ほど<プロパティとファイルのコンテンツのインデックスを作成する>に関して簡単に説明しましたが、必ずしもファイルの中身をインデックス化できるとは限りません。そもそもWindows 7では、「IFilter」というファイルからテキスト内容を取り出すためのロジックを使用していますので、そのファイルに対するIFilterが必要となります。 Windows 7には「%ProgramFiles%\Common Files\microsoft shared\Filters」フォルダ、もしくは「%ProgramFiles(x86)%\Common Files\microsoft shared\Filters」フォルダを用意し、Microsoft謹製のフィルタファイルを格納していますが、「%windir\System32」フォルダに格納さ

  • PDF内のテキストをまとめて書き出したい場合は

    連載「ビジネスの悩みを解決するPDFドリル」とは ビジネスの各シーンで利用するPDFファイル。このドリルを練習して、PDFを上手に活用できれば業務効率が向上し、コストの削減ができるはず! さらに、ビジネスのいろいろな問題も解決できるかもしれませんよ。 PDFの中に書かれているテキストを、別の書類に使いたいという場合がある。部分的に取り出すだけであれば範囲を選択して右クリック → コピーをすればよいが、選択範囲が複雑に入り組んでいたり、何ページにもわたるようなときは面倒だ。 こうした場合は、Adobe Acrobat XIでテキストを丸ごと書きだしてしまえばよい。対象のPDFを表示した状態で「ファイル」→「その他の形式で保存」→「その他のオプション」→「テキスト(プレーン)」を選択すると、PDF内にあるテキストデータが丸ごと書き出される。範囲選択がしにくい個所や、うっかり見落としがちな個所ま

    PDF内のテキストをまとめて書き出したい場合は
  • 1