p.49より、HTMLの解析。 pythonではBeautiful Soupを使ってHTMLを解析しているが、RubyなのでHpricotを使う。 hpricotは既に3章序盤でHTMLタグ除去にも使ったが、今回はタグの中身を取り出しに深入りしていく。 3章 その2 - 橋本詳解 pylori*style wiki - HTMLパーサ Hpricot AnHpricotShowcase on Hpricot インストール gem install hpricot p.49の http://kiwitobes.com/wiki/Programming_language.html のリンクを読むのと同じ内容のコード。 hpricot-test.rb #!/opt/local/bin/ruby require 'rubygems' require 'kconv' require 'open-uri