顔に見える?最近「送水口」が気になるという話 「送水口」が気になる今日この頃 最近街中で気になる存在、それがこの「送水口」です。地上のフロアが7階以上あるビルなど、一定の条件を満たした建築物には設置が義務付けられているもので、火事が発生したフロアにただちに水を送るために使われるものです。ポンプ車…
ElementTree のページに書いてあることだけど、メモとして。 xml.etree.ElementTree.iterparse を使うと、DOM のようにメモリを食わず、SAX よりプログラムしやすいかと思いきや、試しに Wikipedia のダンプデータを食わしてみたら、がんがんメモりを食う。まぁ、ルートエレメントの end イベントのときに、配下のノードがすべて必要になるので当然なんだけど。で、対策は毎回ルートエレメントの配下をクリアするということらしい。 ということで、Wikipedia のデータを処理するときはこんな感じ。 import xml.etree import ElementTree WIKIPEDIA_NAMESPACE = 'http://www.mediawiki.org/xml/export-0.3/' class Page(object): __slots
« twitter followerの小難しい発言に読みをふってくれるサービス「よみふったー」をリリースした。 | Main | 床屋 » 書き換えてしまえ... *** elementtree/ElementTree.py.orig Thu Apr 24 21:02:09 2008 --- elementtree/ElementTree.py Thu Apr 24 21:34:42 2008 *************** *** 1252,1254 **** --- 1252,1267 ---- tree = self._target.close() del self._target, self._parser # get rid of circular references return tree + + try: + from xml.parsers import exp
In this post, we have explained in detail how to deal with XML files in Python. We will also see some of the complex terms of ElementTree module. What are XML files?Extensible Markup Language (XML) is a file format that is used for the serialization of data, that is, storing, transmitting, and reconstructing arbitrary data, in a format that is both human-readable and machine-readable. As a markup
正直どうかと思うよ。 きちんとしてない XML の解析は BeautifulSoup でやる方が楽。 インポート Python 2.5 からは標準モジュールになったので場所が違うらしい。 try: from xml.etree import ElementTree except: from elementtree import ElementTree 文字列から解析 root = ElementTree.fromstring(contents) エレメント 真偽値は常に False になるっぽい #タグ名 しばしば名前空間が付くので使いにくい e.tag #属性 e.attrib #中身 e.text #子エレメント e.getChildren() #すべて列挙 e.getiterator() #検索 XPathのサブセット e.find(path), e.findall(path) 名前
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く