一定期間更新がないため広告を表示しています
試す環境は MacBook Air で。 $ uname -mrsv Darwin 10.7.0 Darwin Kernel Version 10.7.0: Sat Jan 29 15:17:16 PST 2011; root:xnu-1504.9.37~1/RELEASE_I386 i386 $ ruby -v ruby 1.8.7 (2009-06-12 patchlevel 174) [universal-darwin10.0] $ gem list | grep hpricot hpricot (0.8.4, 0.6.164) $ gem list | grep nokogiri nokogiri (1.4.4) サンプルコード。 Hpricot でも Nokogiri でもほぼ同じように使える。 $ cat ./ru.rb #!/usr/bin/env ruby $KCODE='
写真で振り返る京都旅行 先日文学フリマ京都8に参加するため初めて1人で京都へ行ってきました。随分時間が経ってしまったのでもうブログにまとめなくていいか、と思っていましたが、せっかくなので写真をメインに記録しておこうと思います。 出発▷▶︎▷▶︎わくわく新幹線! 新幹線初心者すぎてか…
2009年07月31日 HpricotからNokogiriに乗り換え スクレイピングを行うためにHpricotを使ったところ、どうやってもbuilder.rbというモジュールで segmentation fault が出てしまうという事態に遭遇した。Hpricot を最新のバージョンである 0.8.1 に上げたが変化なし。 調べてみたところ、これはRuby本体のバグが原因であり、「配列のサイズが途中で変わると起きる」らしいことが分かった(るびまの記事)。が、Hpricot内部の話なので、こちらではどうしようもない。 そこで、最近よく名前を耳にする、Hpricot互換の Nokogiri に乗り換えてみた。HpricotとNokogiriは使い方は非常に似ているのだが、まったく違いがないわけではないので、下記の点を変更した。 ■ require すべきものが当然変わるrequire 'hpr
Overview Overview API Support Tutorials Changelog About Nokogiri¶ Nokogiri (鋸) makes it easy and painless to work with XML and HTML from Ruby. It provides a sensible, easy-to-understand API for reading, writing, modifying, and querying documents. It is fast and standards-compliant by relying on native parsers like libxml2, libgumbo, and xerces. Guiding Principles¶ Some guiding principles Nokogiri
HpricotからNokogiriに移行しようとしていくつか罠にはまったのでメモしておきます。 基本的には require "hpricot" → require "nokogiri" Hpricot(html) → Nokogiri::HTML(html) Hpricot::XML(xml) → Nokogiri::XML(xml) と書き換えるだけで、運が良ければそのまま動くと思います。 Nokogiri(text)というのもあるのですが、これはXMLかHTMLかを自動判定するらしく、失敗することもあるのでお勧めしません。 NokogiriはHpricotと違ってXML名前空間をきちんと解釈するので、XML名前空間を使ったXMLを解析する場合には注意が必要です。XML名前空間を使ったXMLというのは、以下のようにxmlnsなんとかというのが入っているやつです。 <feed xmlns=
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く