昔、訳あってElementTreeのソースコードを電車の中で読んでいたら、となりの人に、これは何かと尋ねられたことを思い出した。その後、プログラムとは何か、ソースとは何かを説明することになるのだが、まぁ、どうでもいいか。 要素の後に来るテキスト <p>hello<span>world</span>thanks</p> span要素の後にあるテキストthanksをどうやって取り出すかというと、span要素の tail で取得する*1。 # python 2.5 import xml.etree.ElementTree as ET root = ET.fromstring('<p>hello<span>world</span>thanks</p>') print root.text, root[0].text, root[0].tail # -- 結果 # hello world thanks