[B! lxml] roogh5eeSha6のブックマーク

lxml: insert tag at a given position

roogh5eeSha6 2020/06/23

リンク

ライブラリ: lxml.etree

lxml.etree は XML 形式のデータを Python で手軽に扱えるようにするライブラリです。 XML 形式のデータがカンタンに扱えるさまざまな機能を備えています。私は jQuery と同等の機能を提供する PyQuery というライブラリを使うのに必要だったので入れました。以下 lxml.etree の基礎的な使い方を見ていきます。 01 インスタンスの作成 lxml.etree において主役となるのは Element と呼ばれるクラスです。 from lxml import etree root = etree.Element("root") print type(root).__name__ # _Elementと表示 print root.tag child1 = etree.SubElement(root, "child1") root.append(etree.E

roogh5eeSha6 2020/06/23

リンク

Python: lxmlの文字コード（tostring()）

roogh5eeSha6 2020/03/23

リンク

Gentleちゃれんじ Tips -lxmlでhtmlを処理する-

lxmlでhtmlを処理する Pythonでhtmlを取り扱う際は、「htmllib(標準モジュール)」や「Beautiful Soup」といったモジュールがあります。しかし、高速で柔軟な操作がしたい場合は、「lxml」がいいということなので、今回はlxmlでhtmlを操作する方法をメモしたいと思います。 lxmlは、Beautiful Soupより高速で、htmllibより柔軟なhtml(xml)操作を可能にするのですが、日本語資料が少ないと言うのが難点でした。最低限のことならば、ちょっと英語を読めば、何とかなりますが、ちょっと凝ったことをしようと思うと英語力がネックでつまづいてしまいました…。そこで、今回は、自分がつまづいた所を中心に紹介したいと思います。目次 htmlから情報を抽出する htmlソースを改変するまとめと補足 1. htmlから情報を抽出する htm

roogh5eeSha6 2020/03/23

リンク

テールなしでlxmlのノードからタグを削除するにはどうすればよいですか?

roogh5eeSha6 2020/03/15

lxml
削除

リンク

PythonのlxmlでXMLを扱う - iMind Developers Blog

概要 lxmlはlibxml2とlibxsltのPythonバインディング。XMLの生成、パース、XPath等、一般的な操作が一通りできる。今回はXMLのパース、編集、保存等の基本的な処理を触ってみる。バージョン情報 Python 3.6.5 lxml==4.2.4 サンプルデータ valuesタグの配下にvalue1, value2, value3という要素があるXMLを用意する。 <root> <values> <value1 atr="x"></value1> <value2 att="x">2</value2> <value3 att="y">3</value3> </values> </root> 当該XMLは data/lxml_exmaple/foo.xml というパスに保存されているものとする。 XMLファイルの読み込み etree.parseでXMLファイルを読み込め