前回はWebサイトをクロールするところまで書いたので、 次は取得したページを解析して、必要な情報を抜き出します。 必要な情報を抜き出すには、 nokogiriというライブラリを使えばいいみたいです。 使い方は簡単で、 nokogiriライブラリを使えるようにする require 'nokogiri' anemoneで取ってきたpageのHTMLデータをnokogiriオブジェクトに変換する doc = Nokogiri::HTML.parse(page.body.toutf8) doc.xpathメソッドで欲しい情報を抜き出す rank = item.xpath("//div[1]").text これだけです。 これならすぐできると思い、 さっそく本に書かれた内容を写して実行してみたんですが、 実行結果が本に載っているものと違う・・・。 どうやらamazonのWebサイトが少し変わったよう
![Rubyによるクローラー開発技法 vol4 ~nokogiri~ - 1人でアプリを作れるように](https://cdn-ak-scissors.b.st-hatena.com/image/square/51b0322cf52f872a665688f4c5cb2d710fed5178/height=288;version=1;width=512/http%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Ft%2Ftumiki_jp%2F20150715%2F20150715211327.png)