タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

RubyでHTMLパーサに関するadamrockerのブックマーク (2)

  • VikiWiki - htree

    htreeとは Rubyのライブラリ。XMLパーサでもあり、テンプレートエンジンでもある。 テンプレートエンジンはsamidareで使われている。 公式ドキュメント。 htreeの挙動は順次変更になっています。 この解説は、2004/05/30に落としてきたバージョンのhtreeに関するものです。 パース urlからパースして、テキストが空でない要素のパスと内容を表示。とりあえずエンコードのハナシは無視。 require 'htree' require 'open-uri' url="http://kitchon.ddo.jp/~ashiya/diary" ht=HTree.parse(open(url).read) ht.make_loc.traverse_element do |n| txt=n.node.extract_text.to_s if txt !~ /^(\s\t\n\r)

    adamrocker
    adamrocker 2007/01/23
    HTMLパーサのHTreeの説明。XPathでのアクセスを可能にするto_rexmlメソッドを使えばREXMLオブジェクトとして扱える。
  • 1