タグ

ブックマーク / perezvon.hatenablog.com (1)

  • lxmlメモ帳 - スコトプリゴニエフスク通信

    以前、lingrでlxmlをdisっている人を見たとき、その人のペースに巻き込まれて、lxmlってそういうもんだと思い込んでしまいました。ただ、最近lxmlを使い始めて、なかなかちゃんとしていることが分かってきたので、メモを書き溜めて行こうと思います。というか、オフィシャルなドキュメントの写経に近いのですが。 文字列からElementオブジェクトを生成するetree.fromstringを使う。 from lxml import etree el = etree.fromstring("spam") 整形式XMLでない場合etree.parseの第二引数にetree.HTMLParser()を指定。 from lxml import etree el = etree.fromstring("spam", etree.HTMParser()) 非UTF-8でエンコードされたXML(風の文字列

    yuya_presto
    yuya_presto 2011/01/28
    <br>タグに囲まれた,<br>タグと混ざっているテキストは,itertext()で取得.
  • 1