lxml.etree は XML 形式のデータを Python で手軽に扱えるようにするライブラリです。 XML 形式のデータがカンタンに扱えるさまざまな機能を備えています。 私は jQuery と同等の機能を提供する PyQuery というライブラリを使うのに必要だったので入れました。 以下 lxml.etree の基礎的な使い方を見ていきます。 01 インスタンスの作成 lxml.etree において主役となるのは Element と呼ばれるクラスです。 from lxml import etree root = etree.Element("root") print type(root).__name__ # _Elementと表示 print root.tag child1 = etree.SubElement(root, "child1") root.append(etree.E
lxmlでhtmlを処理する Pythonでhtmlを取り扱う際は、「htmllib(標準モジュール)」や 「Beautiful Soup」 といったモジュールがあります。 しかし、高速で柔軟な操作がしたい場合は、 「lxml」がいいということなので、 今回はlxmlでhtmlを操作する方法をメモしたいと思います。 lxmlは、Beautiful Soupより高速で、htmllibより柔軟なhtml(xml)操作を可能にするのですが、 日本語資料が少ないと言うのが難点でした。最低限のことならば、ちょっと英語を読めば、 何とかなりますが、ちょっと凝ったことをしようと思うと英語力がネックでつまづいてしまいました…。 そこで、今回は、自分がつまづいた所を中心に紹介したいと思います。 目次 htmlから情報を抽出する htmlソースを改変する まとめと補足 1. htmlから情報を抽出する htm
概要 lxmlはlibxml2とlibxsltのPythonバインディング。XMLの生成、パース、XPath等、一般的な操作が一通りできる。 今回はXMLのパース、編集、保存等の基本的な処理を触ってみる。 バージョン情報 Python 3.6.5 lxml==4.2.4 サンプルデータ valuesタグの配下にvalue1, value2, value3という要素があるXMLを用意する。 <root> <values> <value1 atr="x"></value1> <value2 att="x">2</value2> <value3 att="y">3</value3> </values> </root> 当該XMLは data/lxml_exmaple/foo.xml というパスに保存されているものとする。 XMLファイルの読み込み etree.parseでXMLファイルを読み込め
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く