[B! lxml] moritataのブックマーク

moritata id:moritata

lxmlに関するmoritataのブックマーク (4)

https://www.oasob.com/blog/detail/6/
moritata 2009/10/21
api

サムネイル

python

lxml

youtube

動画
リンク
lxmlで日本語のWebページのタイトルを取得する - Pyro Memo
日本語が化けて大変苦労したのでメモ。結論として、XML（またはHTML）を解析する前にunicode関数に通しておく、ということで良いのかな？相変わらず文字コード関連はよく分からない。 from urllib import urlopen from lxml import etree html = urlopen("http://b.hatena.ne.jp") charset = html.headers.getparam('charset') html_data = unicode(html.read(),charset) et = etree.fromstring(html_data, parser=etree.HTMLParser()) title_element = et.xpath("./head/title")[0] title = title_element.text.e
moritata 2009/10/21
charset

data

encode

python

xml

lxml
リンク
lxml.objectify
moritata 2009/10/21
python

lxml
リンク
lxmlでAmazonAPI (objectify使ってみたよ) - bonlife
bonlifeです。誰かに教えられるほどPython詳しいわけじゃないですが、lxmlのobjectifyはやっぱり便利だよ、ということを伝えたい！だけどもっとレスポンスが速い方法があるはず。誰か教えてw まとめ記事はこちら。(記事中のquoteはurllib2.quoteっぽい。) lxmlのobjectifyを使うとかなり使いやすいオブジェクトが生成されます。最初(objectify.parse)のレスポンスは結構遅そうですが…。 import urllib2 from lxml import objectify host = u'http://webservices.amazon.co.jp/onca/xml?Service=AWSECommerceService' id = u'&SubscriptionId=AWSのアクセスキー' ope = u'&Operation=Ite
moritata 2009/10/21
encode

amazon

api

スクレイピング

code

Python

lxml
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx