こんにちは、ゼロスタート技術部のキツです。 さて、 xml ファイルでも読むか $ ls -hl1 -rw-r--r-- 1 user 3.3G 12 12 23:22 extrahuge.xml と思ったら、 3GB を超えていた。 こんなこと、人生に何度かあると思います。 今回は、 Python で巨大な XML を扱う方法をご紹介させていただきます。 ※Python 2.7.2, elementtree 1.2.7, lxml 3.0.1 にて検証致しました。 今回チャレンジする巨大な XML ファイルは、「シンプルだが巨大」という形式です。 以下のような内容になっています。 <strings> <string>あ</string> <string>い</string> <string>う</string> <string>え</string> <string>お</string>