nokogiriとは gemで提供されているスクレイピングライブラリのこと。 公式サイト http://nokogiri.org/ install gemでインストールする。 使い方 使い方はとにかく簡単。 スクレイピングしたいページにアクセスし、HTMLを取得してきた後、nokogiriを通して各要素にアクセスする。 要素へのアクセス方法は、XPathというものとCSS記法によるものがあるらしいが、普段使い慣れているCSSが使えれば十分だと思った。 サンプル require 'nokogiri' require 'open-uri' html = Nokogiri::HTML(open('https://www.google.co.jp/')) logo = html.css('#hplogo').first # id="hplogo" logo.name # タグ名 logo.attr