タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

perlとWordに関するrin51のブックマーク (1)

  • Microsoft Word 文書からテキストを抽出するモジュールを書いた - daily dayflower

    CPAN にはなさそげだったので書いてみました。 http://svn.coderepos.org/share/lang/perl/MSWord-ExtractContent/trunk/ 名前空間がどうよって気がするけど Word 文書に該当する名前空間が見当たらず,こんな感じにしてしまいました。まぁ coderepos の段階なので。なんかいい名前があったら教えてください。もし CPAN にあげるときにはそれにします。 図をおこしたほうがわかりやすくなるのですが,あんまりに面倒だったので図は描いてません。 Microsoft Word バイナリフォーマット Word バイナリフォーマット*1の仕様は Microsoft が公開しています。下記からダウンロードすることが可能です。 http://www.microsoft.com/interop/docs/officebinaryform

    Microsoft Word 文書からテキストを抽出するモジュールを書いた - daily dayflower
  • 1