「Word docxファイルはzipファイルとして展開できる」って、知ってましたか? シナリオ あなたは、ドキュメント変換ツール「Pandoc」で、Markdownファイルからdocxファイルを生成したい、と考えます。 しかし、いろいろな都合で、docxファイルのフォーマットにかなり手を加える必要がある、とわかりました。 (たとえば、ルビ・脚注・図表など、単純なMarkdownの知識ではどうしようもないようなフォーマットを想定しましょう) 調べた結果、「Pandocフィルタを書いて、docxファイルをいじればよい」とひとまず結論を出します。 さて…… docxの中身ってどうなっているのでしょうか? どうやって、MS Word本体なしで、docxファイルをいじればよいのでしょうか? 下記では、前者の「docxの中身」についてざっくり話します。後者は割愛します。 Office Open XML