View this post on Instagram A post shared by kmuto (@mutokenshi) View this post on Instagram A post shared by kmuto (@mutokenshi) View this post on Instagram A post shared by kmuto (@mutokenshi) View this post on Instagram A post shared by kmuto (@mutokenshi) View this post on Instagram A post shared by kmuto (@mutokenshi) View this post on Instagram A post shared by kmuto (@mutokenshi) View this
楽天APIではレビューが取得できないので、HTMLをスクレイピングした。今まではBeautifulSoupを使ってたんだけど、lxmlがHTMLにも使えるとしったので使ってみた。lxmlはXPathが使えるんだけど、楽天のHTMLがぐちゃぐちゃすぎてかなり苦労した。 ソース from lxml import etree from StringIO import StringIO w_url = "http://review.rakuten.co.jp/rd/2_213310_12781481_0/" html = urllib2.urlopen(review_url).read().decode("euc-jp") root = etree.parse(StringIO(html),parser=etree.HTMLParser()) a =[x.strip() for x in root
Time for a code review upgrade Still on pull requests? See why organizations upgrade to Review Board: Code review, document review, and image review, all in one place Your code and data stays private, secure, and in your control (Review Board won't mine your data for AI training or other purposes) Works with what you use today (such as Git, Mercurial, Perforce, ClearCase, Cliosoft SOS, or TFS), an
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く