タグ

wordとpdfに関するftnkのブックマーク (2)

  • PDFやオフィス文書からテキストを抜き出すツールをテスト公開 - ChupaText 0.5.0 - 2010-11-08 - ククログ

    全文検索エンジンgroongaを囲む夕べ #1 : ATNDの定員が50人から120人に増えましたね。たぶん、何人かはキャンセルするはずなので、今のうちに登録しておくとおそらく参加できるでしょう。興味のある方はお早めに登録してください。 さて、以前、サーバ上でPDFやオフィス文書からテキストを抜き出す方法を紹介しました。これらを使うことにより様々なフォーマットの文書からテキストを抽出し、groongaなどの全文検索エンジンを利用して高速に目的の文書を見つけることができます。例えば、ファイルサーバやデスクトップ上にある文書を検索する用途にも有用です。 しかし、文書のフォーマット毎に抽出方法を変えなければいけないため、実際にテキストを抽出する部分(インデクサーの機能の一部)を作る場合に不便です。文書のフォーマットに依らず、同じ方法でテキストを抽出できると便利ですよね。 ということで、文書のフォ

    PDFやオフィス文書からテキストを抜き出すツールをテスト公開 - ChupaText 0.5.0 - 2010-11-08 - ククログ
  • PDFファイルをWord文書に変換できるツール「PDF to Word Converter」*二十歳街道まっしぐら(FC2ブログ時代)

    PDF to Word Converter」はその名の通り、PDFをWord文書に変換できます。 よくあるのが、WordからPDFにするツールですが、これはその逆です。 海外ツールですが、操作も簡単なのですぐに使いこなせるでしょう。 有料ツールですが、無料で手に入るようなので使ってみました。 詳細は以下より。 まず「PDF to Word Converter」ダウンロードページへアクセスします。 上記画像の左側からダウンロード可能です。 右側ですが、KEYを取得する必要があります。 名前とメールアドレスをいれるだけでOK。「Send me Keycode」をクリックしたら赤文字(メール送信完了通知)がでます。 このようにKEYコードが書かれたメールが届きます。 さて、ダウンロードしたらインストールしましょう。 特別な設定はないので、「NEXT」を次々押していけばOK。 インストール後、起

  • 1