いまどきmechanize も流行らないとおもうけど、PhantomJSはあれだし、Dom構築は面倒だし。まだ数年は使えると思ってる。 Mechanize でサイトのスクレーパーの手順は irb でmechanize 起動 ページに移動 ページに移動してからCSSを探す の手順が王道なんですが。コレが面倒です。 Mechanize に拡張して、キャッシュする pageをGETするたびに、ページのHTMLと、Cookieと、Mechanize::Pageを保存しておいきます。 保存しておいてあとで纏めて解析すれば早いよね。 このようにしておけば、HTMLをどんどん保存しておいて、あとで解析だけをできるので便利ですね。 #coding : utf-8 require 'mechanize' class Mechanize alias_method :orig_get, :get def get