Microsoft MHTML 分解¶ MS-WORD で保存したという mht ファイルを受け取ったのだが、 手元の Word for Mac 2011 で開けない。 中身を less で覗いても、壊れているようには見えなかったので、 ソフトウェアの問題なのであろう。WORD に拘る必要も無いし、 簡単に使える分解ツールは無いものかとググっても、めぼしいものが見つからず、 自分で書いた方が早そうだったので、そうした。 #!/usr/bin/python # encoding: utf-8 import os import sys import errno import email # ファイル名が格納されているフィールド TOJ = 'Content-Location' # 抽出するべきデータ型 TYPES = {"text/html", "image/jpeg"} # 出力先 OUTD
