しかしここではその代わりに、タグを除いたすべてのテキストを出力したいので、構文木のどの部分がテキストなのかを判別する必要がある。BeautifulSoupでは、構文木には2種類のノードが存在し、プレインテキストはNavigableStringで表され、マークアップ部分はTagsになる。Tagsは再帰的な構造になっていて、多くの子を持つことができ、それぞれの子は別のTagsかNavigableStringとなる。 ここでは、構文木の一部分を入力として取る再帰的な関数を書きたい。それがNavigableStringであれば出力し、そうでなければそれぞれの部分木について再び同じ関数を呼び出す。タグを参照してそのタグのすべての子に対して繰り返し処理を行えばよいだけなので、これは難しくない。 from BeautifulSoup import NavigableString def printTex