secondlifeのブックマーク / 2007年2月3日 - はてなブックマーク

secondlife id:secondlife

2007年2月3日のブックマーク (1件)

Hpricot からテキストを取り出す - nazokingのブログ
scrAPIよりも使いやすい感じのHpricotですが、「innerText」が上手くHTMLエンティティーを戻してくれないので、違うメソッドをつけてみました。 require "rubygems" require 'hpricot' class Hpricot::Elem def [](a) CGI.unescapeHTML(get_attribute(a)) end def to_text r = [] traverse_text{|text| case text when Hpricot::CData r << text.content else r << CGI.unescapeHTML(text.inner_text.gsub("\n"," ").gsub(/ +/," ").strip) end } r.join end end hp = Hpricot('<html><bog
secondlife 2007/02/03
String#scrapi のほうが！！！でも scrapi で取り出した HTML::Tag クラスだと css セレクタであれこれできないんだよね..

library

ruby

scrape
リンク
- 2007年2月5日
- 2007年2月3日
- 2007年2月2日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx