タグ

HTMLとpythonに関するiwwのブックマーク (1)

  • Microsoft MHTML 分解 — emaita 備忘録

    Microsoft MHTML 分解¶ MS-WORD で保存したという mht ファイルを受け取ったのだが、 手元の Word for Mac 2011 で開けない。 中身を less で覗いても、壊れているようには見えなかったので、 ソフトウェアの問題なのであろう。WORD に拘る必要も無いし、 簡単に使える分解ツールは無いものかとググっても、めぼしいものが見つからず、 自分で書いた方が早そうだったので、そうした。 #!/usr/bin/python # encoding: utf-8 import os import sys import errno import email # ファイル名が格納されているフィールド TOJ = 'Content-Location' # 抽出するべきデータ型 TYPES = {"text/html", "image/jpeg"} # 出力先 OUTD

    Microsoft MHTML 分解 — emaita 備忘録
    iww
    iww 2016/07/11
    改造して使っている。 とても良い
  • 1