タグ

2006年10月3日のブックマーク (2件)

  • ruby のスクレイピングツールキット scrAPI - 川o・-・)<2nd life

    http://blog.labnotes.org/category/scrapi/ rubyスクレイピングして web の情報を取得するのには、今まで正規表現か xpath でやってたので、わりと面倒でした。で、ふと scrAPI というスクレイピングツールキットを知ったのですが、これがかなり便利そう。 このツールキットを使うと、CSS3 なセレクタを記述することで、要素を取得することができます。たとえばとあるサイトのリンクを全部取得したければ、 require 'rubygems' require 'scrapi' require 'open-uri' require 'nkf' require 'pp' $KCODE = 'u' links = Scraper.define do process "a[href]", "urls[]"=>"@href" result :urls e

    ruby のスクレイピングツールキット scrAPI - 川o・-・)<2nd life
    manabou
    manabou 2006/10/03
    スクレイピング
  • mizzy.org : Using svk with plagger

    Using svk with plagger Posted by Gosuke Miyashita Fri, 29 Sep 2006 13:55:00 GMT うちでは 普段実行している plagger は家 trunk から持ってきていて、自分で作ったプラグインは svn.mizzy.org に置いてあるのですが、以下の様なプロセスで開発してました。 svn.mizzy.org からチェックアウトしたディレクトリに、俺プラグインを書いて置く。 plagger 家 trunk からチェックアウトしたディレクトリに、上記ディレクトリからファイルをコピーして、俺プラグインの動作テスト。 テストが問題なければ、svn.mizzy.org に俺プラグインをコミット。 家 trunk にコミットする場合は、svn co で コミットするファイルだけを指定。 2.のコピーがめんどくさく

    manabou
    manabou 2006/10/03